Cách hoạt động của Search Engine

Cách hoạt động của Search Engine ? SE(Search Engine): Bộ máy tìm kiếm – Để hiểu cách hoạt động của SE thì trước hết chúng ta phải biết Bộ máy tìm kiếm là gì?
Thì theo định nghĩa bình dân bộ máy tìm kiếm (SE) là một bộ máy để tìm kiếm thông tin trên mạng Internet mà dữ liệu được truy vấn và trả về kết quả mỗi khi người dùng tìm kiếm.

Cách hoạt động của Search Engine

Cách hoạt động của Search Engine

Theo tôi được biết thì bộ máy tìm kiếm (SE) nghĩa là:

  •         Công cụ giúp người dùng tìm kiếm thông tin.
  •         Tìm kiếm thông tin bằng cách nhập cụm từ truy vấn mong muốn.
  •         Bao gồm tìm kiếm nội dung trên một website hay tìm kiếm trên tất cả website.
  •         Các bộ máy tìm kiếm phổ biến như Google, Yahoo, Bing , Baidu, Yandex, Ask…

Tìm kiếm thông tin trên mạng Internet quả thật là một thách thức lớn lao. Nó không giống như việc bới các hạt đỗ đen nằm lẫn lộn trong thùng gạo, bởi dữ liệu trên mạng Internet do con người đưa vào, chúng cũng có cấu trúc và tổ chức xác định (mặc dù thiếu tính nhất quán), trong khi đó thì các hạt đỗ đen lại nằm rải rác và lộn xộn, không có một vị trí hay qui luật nào. Tuy nhiên, bài toán tìm kiếm khó hơn bài toán nhặt đỗ đen rất nhiều. Muốn tìm tất cả các hạt đỗ đen, bạn đơn giản chỉ cần thiết kế một cái sàng hình cầu đủ lớn để có thể đổ cả thùng gạo vào đó, với những chiếc lỗ có kích thước phù hợp sao cho hạt gạo chui lọt còn hạt đỗ đen thì không, và quay đủ số vòng để tất cả các hạt gạo đều có cơ hội bay ra ngoài. Việc tìm kiếm thông tin trên Internet lại hoàn toàn khác.

Có tới hàng chục tỉ trang Web tràn ngập trên mạng Internet (gấp nhiều lần số hạt gạo trong thùng), và vấn đề là làm sao đưa ra những gì ta muốn thu thập sao cho đồng thời thỏa mãn hai tiêu chí: Chính xác và nhanh chóng. Hơn thế nữa, người dùng cũng không đủ kiên nhẫn để ngồi duyệt qua tất cả các trang web chứa thông tin cần tìm (anh ta cũng không nhất thiết phải đếm từng hạt đỗ đen, tuy nhiên nếu xét trên tiêu chí dinh dưỡng thì đa phần những hạt đỗ đen đều giống nhau, do đó hạt nào cho vào nồi trước cũng không quan trọng). Trên thực tế, người dùng hiếm khi vào quá mười trang web kết quả, và vì thế, một yêu cầu khó khăn nữa cần giải quyết, đó là: những gì phù hợp nhất phải được đặt lên hàng đầu.

Vậy chúng ta đã hiểu thế nào là bộ máy tìm kiếm, vậy thì nó SE hoạt động như thế nào ? Cách hoạt động của Search Engine ?

  •         Thu thập dữ liệu (crawling).
  •         Lập chỉ mục (index).
  •         Phân tích và xử lý dữ liệu.
  •         Người dùng tìm kiếm thông qua các truy vấ.
  •         Phản hồi thông tin từ các dữ liệu đã xử lý.

Chỉ là một vài định nghĩa để tìm hiểu, có gì hay các bạn góp ý chia sẽ nhé.

VN:F [1.9.22_1171]
Rating: 10.0/10 (1 vote cast)
VN:F [1.9.22_1171]
Rating: 0 (from 0 votes)
Cách hoạt động của Search Engine, 10.0 out of 10 based on 1 rating

Share and Enjoy

  • Facebook
  • Twitter
  • Delicious
  • LinkedIn
  • StumbleUpon
  • Add to favorites
Email
Print
WP Socializer Aakash Web