Wednesday, April 4, 2012

Tải tập tin bằng lệnh wget trong linux

Nguồn: http://khanh.com.vn/post/2011/04/11/Tai-tap-tin-bang-lenh-wget-trong-linux.aspx

1. Tại sao dùng wget?

Trong môi trường UNIX/Linux, chúng ta có thể di chuyển tới các thư mục một cách nhanh chóng bằng lệnh cd (change directory) trong cửa sổ lệnh Terminal. Nếu một lúc nào đó chúng ta muốn lấy một tập tin từ Internet về và lưu ở thư mục hiện hành thì sẽ mất nhiều thời gian hơn khi như phải sử dụng trình duyệt web để tải tập tin và lựa chọn thư mục để chứa tập tin ấy. Với công cụ wget sẵn có trong UNIX/Linux, chúng ta có thể tải trực tiếp tập tin về thư mục hiện hành.

2. Dùng wget như thế nào?

Cấu trúc lệnh cơ bản của wget chỉ ngắn gọn như sau:

wget http://địa-chỉ-trang-web/tập-tin

Chẳng hạn như chúng ta muốn tải một tập tin MP3 vào thư mục dành riêng cho MP3 (/media/Data/Audio/Music/), chúng ta chỉ cần 2 câu lệnh sau:

cd /media/Data/Audio/Music
wget http://địa-chỉ-trang-web/tập-tin.mp3

Trong trường hợp muốn xem qua mã HTML của một trang web hoặc nội dung một tập tin văn bản dạng text, chúng ta cũng có thể dùng wget thay vì mở địa chỉ ở trình duyệt:

wget -q -O - http://địa-chỉ-trang-web/tập-tin

3. Dùng wget qua proxy

Trong một số trường hợp, chúng ta không thể tải trực tiếp dữ liệu từ một trang web, mà cần phải truy cập qua một proxy trung gian. Chúng ta có thể cài đặt thông số proxy cho trình duyệt web, nhưng việc đó sẽ làm chúng ta mất nhiều thời gian nếu như chỉ để tải 1 tập tin từ 1 trang web nào đó rồi lại gỡ bỏ các thông số proxy khỏi trình duyệt.

Chỉ bằng 1 câu lệnh đơn giản trong cửa sổ lệnh Terminal, chúng ta đã có thể dùngwget một cách bình thường. Câu lệnh này giúp chúng ta truy cập các địa chỉ web qua proxy:

export HTTP_PROXY="http://địa-chỉ-proxy:cổng-proxy/"

Khi đó câu lệnh wget có thể được sử dụng bình thường như trước. Trong trường hợp bạn cần tải tập tin từ một địa chỉ qua giao thức FTP thì bạn cần thêm biến FTP_PROXY theo cách tương tự:

export FTP_PROXY="http://địa-chỉ-proxy:cổng-proxy/"

Bạn lưu ý là mặc dù thiết lập chế độ sử dụng proxy cho giao thức FTP nhưng giao thức của địa chỉ proxy vẫn phải là “http”.

Sau khi tải tập tin bằng wget xong, nếu bạn muốn xóa bỏ chế độ sử dụng proxy thì dùng câu lệnh:

env -u HTTP_PROXY

và/hoặc

env -u FTP_PROXY

hay chỉ đơn giản là khởi động lại máy tính, vì biến môi trường tạo bởi lệnh exportkhông được lưu trữ vĩnh viễn, mà cần được khởi tạo lại nếu cần, mỗi khi máy tính đã được khởi động lại.

No comments:

Router Packet Networking

Đây là video ngắn khá hay, mô tả đường đi của một gói tin trên Mạng Internet.