Cách lấy toàn bộ dữ liệu bài viết của một blog bất kỳ và cách ngăn chặn

Dữ liệu hay data chính là những bài viết, những trang trong blog. Chúng ta có thể lấy được dữ liệu đó là do 1 tính năng mà blogspot cung cấp – RSS – ATOM – Nguồn cấp dữ liệu bài đăng.


Một số người lấy dữ liệu của chính blog của họ để đăng lên site vệ tinh, cũng có một số lười viết bài nên đi ăn cắp dữ liệu của blog khác. Làm sao mà họ làm được điều đó?
Ở bài viết này mình sẽ hướng dẫn các bạn cách lấy toàn bộ dữ liệu bài viết của một blog bất kỳ và cách ngăn chặn người khác lấy dữ liệu của blog mình.

HƯỚNG DẪN THỰC HIỆN

1. CÁCH LẤY DỮ LIỆU BÀI VIẾT CỦA BLOG BẤT KỲ

Bước 1: Xác định tổng số bài viết của blog cần lấy cắp dữ liệu
Các bạn truy cập link sau: http://www.bacsiwindows.com/p/test-code.html
Sau đó các bạn copy đoạn code sau vào Khung nhập mã rồi nhấn Xem trước nhanh

<script style=”text/javascript”>
function showpostcount(json) {
document.write(‘<center>Tổng số bài: <b>’ + parseInt(json.feed.openSearch$totalResults.$t,10)
+ ‘</b></center>’);}</script>
<script src=”http://bloglaydulieu.blogspot.com/feeds/posts/default?alt=json-in-script&callback=showpostcount”></script>

Nhớ thay bloglaydulieu.blogspot.com bằng địa chỉ blog mà bạn cần lấy dữ liệu.

Bước 2: Lấy dữ liệu về máy
Copy đường link dưới:

http://bloglaydulieu.blogspot.com/atom.xml?redirect=false&start-index=X&max-results=Y

Trong đó:
 bloglaydulieu.blogspot.com : là đường link blog mà bạn muốn lấy dữ liệu
 X: Bài bắt đầu lấy (Lấy từ bài đầu tiên thì X là 1)
 Y: Tổng số bài sẽ lấy tính từ X (Tổng số bài không vượt quá 500)
Ví dụ: Blog muốn lấy dữ liệu có 200 bài viết thì đường link trên sẽ là:
http://bloglaydulieu.blogspot.com/atom.xml?redirect=false&start-index=1&max-results=200

Để tải dữ liệu về máy bạn có 2 cách:

CÁCH 1: SỬ DỤNG TRÌNH DUYỆT


Paste đường link đó vào trình duyệt. Chờ load xong thì click chuột phải chọn “Lưu thành“. Ta sẽ lưu được 1 file .xml


CÁCH 2: SỬ DỤNG INTERNET DOWNLOAD MANAGER (IDM)

Mở IDM lên => Ấn “Add URL” => Paste link trên vào rồi chọn “OK

Cuối cùng ấn “Start  Download” để tải file

Bước 3: Nhập dữ liệu (import data) vào blog của bạn
Đăng nhập Blog => Cài đặt => Khác => Ấn Nhập nội dung

Chọn tôi không phải người máy rồi click Nhập từ máy tính

Chọn file .xml vừa tải về để import lên blog của bạn => Ấn Open

Vậy là xong.

2. CÁCH NGĂN CHẶN NGƯỜI KHÁC LẤY DỮ LIỆU BLOG CỦA MÌNH

Để tránh bị tình trạng lấy cắp dữ liệu, bạn hãy làm theo những bước sau để tự bảo vệ blog của mình
Đăng nhập blog => Cài đặt => Khác => Tại phần “Cho phép nguồn cấp dữ liệu blog” Chọn “Cho đến dấu ngắt” rồi “Lưu cài đặt” lại


Làm xong như trên thì khi ai đó lấy cắp dữ liệu của blog bạn thì sẽ chỉ lấy được từ đầu bài viết đến phần có dấu ngắt thôi
Bây giờ, mỗi khi đăng bài, bạn cần chèn dấu ngắt nhảy cho bài viết để khi ai đó lấy dữ liệu thì cũng chỉ lấy được đến dấu ngắt là hết.
Cách chèn dấu ngắt nhảy:
– Đặt con trỏ chuột vào vị trí cần ngắt, tốt nhất là ở sau bức hình đầu tiên hoặc sau 1 đoạn văn ngắn phần đầu.
– Ấn nút “Chèn dấu ngắt nhảy” trên thanh bài viết

Cuối cùng đã xong.

LỜI KẾT

Vậy là ở bài viết này mình đã hướng dẫn các bạn cách lấy toàn bộ dữ liệu bài viết của một blog bất kỳ và cách ngăn chặn trên blog của chính mình rồi.
Hi vọng với thủ thuật nhỏ này sẽ giúp ích cho các bạn.
Chúc các bạn thành công!
Nếu bạn gặp bất cứ lỗi nào trong quá trình thực hiện vui lòng để lại comment bên dưới bài viết.

Leave a Comment

sơn epoxy / sơn sàn epoxy / cửa lưới chống muỗi / vách ngăn lướii chống muỗi / cửa lùa chống muỗi / vệ sinh công nghiệp / đánh bóng sàn bê tông / vệ sinh nhà máy / dịch vụ giặt thảmm / vệ sinh nhà hàng / vệ sinh tòa nhà / dịch vụ vệ sinh kính / vệ sinh khách sạn / vệ sinh chung cư / dịch vụ cắt cỏ / đánh bóng kính / diệt côn trùng / diệt mối / diệt kiến / diệt muỗi / diệt ruồi / diệt gián / diệt chuột / dọn bể nước ngầm / phụ kiện mái che / cơ khí chế tạo / mái che di động / rèm nhựa / vách nhựa ngăn phòng lạnh / rèm nhựa phòng lạnh / dù che nắng / mái kéo di động / nhà bạt di động / mái xếp di động / mái hiên di động / thay bạt mái hiên di động / bạt che nắng / phụ kiện mái che di động / mái che sân thượng / mái che quán cafe / mái che di động miền bắc / mái che di động miền nam / bạt che di động hcm /