phim Tân Lạc Thần Người
ta cho rằng
các cơ
sở
dữ
liệu
do web robot tạo
ra có thể
được
cập
nhật
tự
động
nhưng
cho đến
thời
điểm
này vẫn
chưa
có cơ
chế
kiểm
soát sự
thay đổi
trên web một
cách hiệu
quả.
Cập
nhật
thông tin rất
quan trọng
nhưng
qúa thường
xuyên là điều
không cần
thiết.
Xuất
phát từ
thực
tế
đó HTTP đưa
ra kỹ
thuật
‘if – Modified – Since’ giúp các user – agent xác định
được
thời
điểm
tài liệu
thay đổi.
Robot phát hiện
điều
này chỉ
khi nó lưu
lại
các thông tin cũ nhưng
sẽ
tốn
nhiều
bộ
nhớ
& cần
dữ
liệu
phức
tạp.
Một
trong những
đặc
tính phổ
biến
của
robot là khả
năng tiếp
nhận
các từ
cần
tìm trong khi vẫn
thu thập
dữ
liệu.
Tuy nhiên một
số
người
cho rằng
đặc
tính này không đáng hoan nghênh bởi
hai lý do :phim Tân Lạc Thần Đầu
tiên, các tác vụ
tìm kiếm
của
người
sử
dụng
cuối
(end - user) góp phần
đẩy
server vào chỗ
quá tảiThứ
hai, không có cơ
sở
đảm
bảo
có mối
quan hệ
giữa
các từ
cần
tìm, đúng chính tả
và tối
ưu
đối
với
cơ
sở
dữ
liệu.
Ví dụ,
nếu
bộ
tìm kiếm
không hỗ
trợ
các
toán tử
boolean, một
user cần
dữ
liệu
về
xe máy muốn
có được
thông tin đúng thay vì nhập
vào cụm
từ
‘Ford and garage’ phải
nhập
vào từ
‘car’. Nhưng
người
đó không hề
ý thức
được
điều
này. Một
khía cạnh
nguy hiểm
nữa
bắt
nguồn
từ
sự
định
hướng
sai lầm
của
end – user. Một
số
người
sử
dụng
công cụ
của
mình rất
tốt
như
dự
đoán được
lượng
tài liệu
lớn
nhất
có thể
có, bi
Không có nhận xét nào:
Đăng nhận xét