Giới thiệu sơ về phần mềm Web Automation, phần mềm Web Automation ra đời với mục đích thay thế các công việc mang tính chất lặp đi lặp lại như điền biểu mẫu tự động, trích xuất tổng hợp thông tin một cách tự động.
Trước khi vào bài chi tiết, bạn hãy tải phần mềm Web Automation phiên bản mới nhất.
Phần mềm Web Automation là phần mềm mã nguồn mở cam kết không chứa bất kỳ đoạn mã nào gây hại cho máy tính của bạn, nếu bạn không muốn tải về từ liên kết bên trên các bạn có thể truy cập vào mã nguồn và tự build lại cho mình chương trình cho mình sử dụng cũng được, hoang nghênh đóng góp từ mọi người để giúp phần mềm ngày càng hữu dụng hơn
Bài hướng dẫn hôm nay chia làm 3 nội dung chính:
- Hướng dẫn mở các trang web bằng dòng lệnh
- Hướng dẫn cách tự động điền thông tin, tự động click chuột
- Hướng dẫn cách trích xuất thông tin và lưu ra tập tin
Video hướng dẫn sử dụng
1. Hướng dẫn mở trang web bằng dòng lệnh
- Sau khi tải phần mềm Web Automation, hãy giải nén ra một thư mục trong thư mục bạn sẽ thấy tập tin WebAutomation.exe, mở tập tin này lên
- Giao diện chính của chương trình sẽ như thế này
- Nhập trang web cần mở và nhấn nút Go để mở một trang web (ví dụ: mình nhập http://vietsofts.thangdc.com)
- Bạn sẽ nhận được thông báo là có đi đến trang web này hay không, nếu bạn chọn Yes thì chương trình sẽ mở ra một textbox để bạn nhập trang web muốn di chuyển
- Tiếp theo ví dụ như mình muốn mở lần lượt 3 trang web là tuoitre.vn, thanhnien.vn và vnexpress.net thì mình sẽ làm như thế nào. Các bạn chép đoạn mã sau và dán vào thanh công cụ lập trình sau đó nhấn nút chạy để kiểm tra.
go('tuoitre.vn');
sleep(5, false);
go('thanhnien.vn');
sleep(5, false);
go('vnexpress.net');
- Dòng lệnh đầu tiên sẽ mở trang tuoitre.vn sau đó nó sẽ đợi 5 giây để trang web được tải, tiếp theo sau khi chờ xong 5 giây, trang thanhnien.vn sẽ được tải và tiếp tục cho trang vnpress.net
2. Hướng dẫn điền thông tin và tự động click chuột
- Đầu tiên là mở trang vnexpress.net sau đó đợi trang vnexpress.net tải trong 5 giây, tiếp theo điền chữ "obama" vào khung tìm kiếm và sau đó nhấn nút tìm kiếm, sau đó hiện thông báo đã xong.
- Nhấn chuột phải vào khung tìm kiếm trên vnexpress.net, chọn Fill => Textbox
- Sau đó nhập alert('Xong'); để hiển thị thông báo khi chương trình chạy xong, cuối cùng toàn bộ dòng lệnh sẽ là:
//Open Website
go("http://vnexpress.net/");
sleep(5,false);
fill("inp_keyword", "obama");
click("/html/body/div/div/ul[2]/li[3]/div/div/input[2]");
alert('Xong');
- Nhấn nút "Chạy" đợi chương trình tự động mở trang vnexpress.net sau đó đợi 5 giây để trang web được tải, sau đó chương trình sẽ tự động điền chữ obama vào khung tìm kiếm, tự nhấn nút tìm kiếm, tiếp theo sẽ hiện thông báo Xong, đợi giây lát để trang tìm kiếm hiện ra
3. Hướng dẫn cách trích xuất thông tin và lưu ra tập tin
- Mình muốn lấy tiêu đề trong chuyên mục tin thế giới của vnexpress.net mình sẽ phải làm như thế nào?
- Đầu tiên mình vào trang vnexpress.net sau đó nhấn vào chuyên mục tin thế giới,
- Trong công cụ lập trình nhập vào nội dung sau:
go('http://vnexpress.net/tin-tuc/the-gioi');
sleep(5, false);
- Mục đích là mở chuyên mục thế giới trước khi trích xuất tin tức trong đó
- Tiếp theo kéo xuống phần nội dung, nhớ là từ tin thứ 2 vì tin đầu tiên nó khác với những tin còn lại, mình chọn tin "Triều tiên hối thúc Hàn Quốc hội đàm quân sự", nhấn chuột phải tại tiêu đề này sau đó chọn "Trích xuất" => Text
- Sau đó trong thanh công cụ sẽ hiện ra đoạn mã lặp qua các tiêu đề để lấy ra thông tin, nhấn nút Chạy, sau đó chọn qua Tab Xem trước, bạn sẽ thấy các tiêu đề trong chuyên mục thế giới được trích xuất.
- Để lưu lại thông tin này các bạn hãy thực hiện các bước sau, nhấn chuột phải trên trang web, chọn Explore => Create File
- Bạn sẽ thấy đoạn mã sau được thêm vào: save('content', 'path', 'isAppend'), có 3 tham số: đầu tiên là nội dung cần lưu, thứ 2 là đường dẫn đến tập tin và tham số cuối cùng là có ghi đè nội dung hay không.
- Mình sẽ sửa lại đoạn mã trên để ghi ra tập tin 'vnexpress.txt'
go('http://vnexpress.net/tin-tuc/the-gioi');
sleep(5, false);
var content = '';
for(i = 1; i <= 25; i++)
{
var text = extract("/html/body/div[4]/div[3]/div/div/div[3]/div/div/ul/li["+ i +"]/div/div/a", "text");
content += text + '\r\n';
}
//Create File
save(content, 'D:\\vnexpress.txt', true);
Kết luận: Vậy là hôm nay mình đã xong 3 phần hướng dẫn các bạn sử dụng phần mềm Web Automation để có thể mở bất kỳ một trang web nào một cách tự động, hay tự động điền nội dung vào khung tìm kiếm và tự nhấn nút tìm kiếm một cách hoàn toàn tự động, bên cạnh đó phần quan trọng nhất là tự động trích xuất thông tin từ trang web bất kỳ và lưu lại để xử lý.
0 nhận xét