Hành trình Google tìm kiếm như thế nào ?

Trước khi bạn tìm kiếm, Google sử dụng rô bốt phần mềm, được gọi là trình thu thập thông tin để tìm các trang web nhằm đưa vào kết quả tìm kiếm của Google sau này

Trước khi bạn tìm kiếm

Cuộc hành trình của một truy vấn tìm kiếm bắt đầu từ rất lâu trước khi bạn nhập tìm kiếm của bạn vào Google. Google sử dụng rô bốt phần mềm, được gọi là trình thu thập thông tin hoặc trình thu thập dữ liệu, để tìm các trang web nhằm đưa vào kết quả tìm kiếm của Google sau này. Phần mềm của Google lưu trữ dữ liệu về các trang này trong trung tâm dữ liệu web giống như một quyển sách với hàng nghìn tỷ trang và công việc của Google là lập chỉ mục quyển sách đó.

Chỉ mục của Google có dung lượng hơn 100 triệu gigabyte.

Cho đến nay Google đã dành hơn 1 triệu giờ tính toán để lập chỉ mục.

Khi bạn tìm kiếm

Khi bạn bắt đầu tìm kiếm, đó là khi thuật toán của Google bắt đầu tìm thông tin bạn đang mong đợi.

Truy vấn tìm kiếm di chuyển trung bình 2400 km để lấy câu trả lời về cho bạn (và trên đường đi có thể ghé qua nhiều trung tâm dữ liệu khác nhau trên toàn thế giới) với vận tốc gần bằng vận tốc ánh sáng, hàng trăm triệu ki lô mét mỗi giờ.

Khi bạn nhập truy vấn của mình, bạn sẽ bắt đầu thấy các dự đoán tìm kiếm bạn có thể đang mong đợi và các kết quả tìm kiếm được hiển thị mà bạn không phải bấm enter. Điều này giúp tiết kiệm thời gian của bạn và giúp bạn có câu trả lời nhanh nhất có thể. Google gọi đây là Google Instant.

Hành trình tìm kiếm của Google

Thuật toán Google hoạt động thế nào ?

Thuật toán xem xét truy vấn của bạn và sử dụng hơn 200 tín hiệu để quyết định trang và nội dung nào trong số hàng triệu trang và nội dung là câu trả lời liên quan nhất với truy vấn đó. Google tinh chỉnh các thuật toán xếp hạng của mình với hơn 500 cải tiến mỗi năm. Ví dụ về các dấu hiệu này bao gồm:

  • Google so sánh các từ khóa với danh sách các trang mạng họ thu thập được.
  • Khi nhiều trang mạng cùng có liên kết đến một trang. Đặc biệt là khi những trang mạng ban đầu cũng được nhiều trang khác liên kết tới, số lượng trang web khác liên kết với một trang cụ thể và thẩm quyền của những liên kết đó.
  • Thông tin về vị trí của máy tính hay trong cụm từ được tìm kiếm cũng được sử dụng.
  • Lịch sử tìm kiếm cũng ảnh hưởng tới kết quả.
  • Mức độ mới của nội dung trên một trang web.
  • Từ trên trang web.
  • Từ đồng nghĩa với từ khóa tìm kiếm của bạn.
  • Kiểm tra chính tả.
  • Chất lượng của nội dung trên trang web.
  • URL và tiêu đề trang web.
  • Liệu kết quả tìm kiếm tốt nhất là trang web, hình ảnh, video, bài viết mới, kết quả cá nhân,v.v...
  • Cá nhân hóa.
  • Kết quả được đề xuất bởi những người kết nối với bạn.

Nhưng Google không công bố cụ thể thuật toán của hãng hoạt động thế nào. Một phần là vì công ty coi đây là bí mật thành công của mình. Cũng như không để cho các trang mạng có thể lợi dụng nhằm tăng thứ hạng tìm kiếm. Google từng thay đổi kết quả của mình những năm qua để ngăn nỗ lực thao túng kết quả tìm kiếm.

Kết quả:

Các kết quả được xếp hạng theo sự liên quan và được hiển thị trên trang. Bên cạnh việc hiển thị kết quả tức thì cho bạn, Google cũng hiển thị bản xem trước của các trang web đó. Bạn có thể thấy bản xem trước này bằng cách di chuột qua các mũi tên ở bên phải kết quả để có thể quyết định nhanh chóng xem đó có phải trang web bạn muốn truy cập không. Trung bình, các Bản xem trước tức thì tải trong 1/10 giây (hiện tại Google bỏ chức năng này).

Thống kê khác:

  • Có hàng tỷ tìm kiếm trên Google mỗi ngày
  • Từ năm 2003, Google đã trả lời 450 tỷ truy vấn độc nhất mới – các tìm kiếm Google chưa bao giờ gặp trước đây.
  • 16% các tìm kiếm Google gặp hàng ngày là tìm kiếm mới.
Theo Google.
(Đà Nẵng, ngày 16/10/2015)
Bài được xem nhiều nhất