Cách hoạt động của thuật toán Tìm kiếm

Bạn muốn câu trả lời, chứ không phải hàng tỷ trang web, và vì thế, hệ thống xếp hạng của Google tìm qua hàng trăm tỷ trang web trong chỉ mục Tìm kiếm để cung cấp cho bạn kết quả hữu ích và phù hợp chỉ trong một phần nhỏ của giây.

Các hệ thống xếp hạng này được tạo thành từ một loạt các thuật toán phân tích nội dung bạn đang tìm kiếm và thông tin gì cần trả về cho bạn. Trong quá trình phát triển Tìm kiếm, để làm cho tính năng này hữu ích hơn, chúng tôi đã tinh chỉnh các thuật toán của mình để đánh giá tìm kiếm và kết quả của bạn một cách chi tiết hơn nhằm làm cho dịch vụ của chúng tôi hoạt động tốt hơn cho bạn.

Sau đây là một số cách Google sử dụng các thuật toán Tìm kiếm để trả về thông tin hữu ích trên web:

  • Phân tích các từ của bạn

    Phân tích các từ của bạn

    Việc hiểu được nghĩa của tìm kiếm của bạn là điều quan trọng để trả về câu trả lời thích hợp. Vì thế để tìm các trang có thông tin liên quan, bước đầu tiên của chúng tôi là phân tích các từ trong truy vấn của bạn có nghĩa gì. Chúng tôi xây dựng các mô hình ngôn ngữ để cố giải mã những chuỗi từ chúng tôi nên tra trong chỉ mục.

    Điều này bao gồm các bước trông có vẻ đơn giản như phân tích các lỗi chính tả, và mở rộng đến cả việc cố gắng hiểu loại truy vấn bạn đã nhập bằng cách áp dụng một số nghiên cứu mới nhất về hiểu ngôn ngữ tự nhiên. Ví dụ: hệ thống từ đồng nghĩa của chúng tôi giúp Tìm kiếm biết được bạn có ý gì, ngay cả khi một từ có nhiều định nghĩa. Hệ thống này mất 5 năm để phát triển và đã cải thiện đáng kể kết quả trong hơn 30% lượt tìm kiếm bằng các ngôn ngữ khác nhau.

    Chúng tôi cũng cố hiểu bạn đang tìm kiếm loại thông tin nào. Đó là một tìm kiếm rất cụ thể hay một truy vấn rộng? Có những từ như "đánh giá", "ảnh" hay "giờ mở cửa" cho biết bạn cần thông tin cụ thể từ tìm kiếm hay không? Bạn có đang tìm kiếm các từ khóa thịnh hành cho thấy rằng bạn muốn nội dung được xuất bản vào ngày đó hay không? Hay bạn đang tìm kiếm một doanh nghiệp lân cận và muốn thông tin về địa phương?

  • Đối sánh tìm kiếm của bạn

    Đối sánh tìm kiếm của bạn

    Tiếp theo, chúng tôi tìm các trang web có thông tin khớp với truy vấn của bạn. Khi bạn tìm kiếm, ở mức độ cơ bản nhất, các thuật toán của chúng tôi sẽ tra cụm từ tìm kiếm của bạn trong chỉ mục để tìm các trang thích hợp. Các thuật toán này phân tích tần suất và vị trí các từ khóa đó xuất hiện trên một trang, liệu chúng xuất hiện trong tựa đề, tiêu đề hay nội dung.

    Cũng như việc đối sánh từ khóa, các thuật toán tìm các gợi ý để đo mức độ phù hợp giữa kết quả tìm kiếm tiềm năng và nội dung người dùng đang tìm kiếm. Khi bạn tìm "chó", có thể bạn không muốn một trang có từ "chó" xuất hiện hàng trăm lần. Chúng tôi cố tìm hiểu xem liệu trang có cung cấp câu trả lời cho truy vấn của bạn không và không chỉ lặp lại truy vấn hay không. Vì thế các thuật toán Tìm kiếm phân tích liệu trang có nội dung thích hợp hay không — chẳng hạn như ảnh, video về chó hay thậm chí danh sách các giống chó. Cuối cùng, chúng tôi kiểm tra xem trang có được viết bằng ngôn ngữ giống như câu hỏi của bạn hay không để ưu tiên các trang bằng ngôn ngữ tùy chọn của bạn.

  • Xếp hạng các trang hữu ích

    Xếp hạng các trang hữu ích

    Đối với một truy vấn thông thường, có hàng nghìn, thậm chí là hàng triệu trang web có thể cung cấp thông tin liên quan. Vì thế, để giúp xếp hạng các trang tốt nhất đầu tiên, chúng tôi cũng viết các thuật toán để đánh giá mức độ hữu ích của các trang web này.

    Các thuật toán này phân tích hàng trăm yếu tố khác nhau để cố hiển thị thông tin tốt nhất có sẵn trên web, từ độ mới mẻ của nội dung cho đến số lần xuất hiện của cụm từ tìm kiếm của bạn và liệu trang có cung cấp trải nghiệm người dùng tốt hay không. Để đánh giá độ đáng tin cậy và nguồn có căn cứ về chủ đề, chúng tôi tìm các trang web có vẻ được nhiều người dùng đánh giá cao đối với cùng truy vấn. Nếu các trang web nổi bật khác về chủ đề này có liên kết đến trang, đó là một dấu hiệu tốt cho thấy thông tin có chất lượng cao.

    Có nhiều trang web spam trên web cố tìm cách vươn lên đầu kết quả tìm kiếm bằng các kỹ thuật như lặp lại từ khóa hay mua các liên kết vượt qua được PageRank. Các trang web này cung cấp trải nghiệm người dùng rất kém và thậm chí có thể gây hại hay nhầm lẫn cho người dùng của Google. Vì thế, chúng tôi viết các thuật toán để xác định spam và xóa các trang web vi phạm nguyên tắc quản trị trang web của Google khỏi kết quả của chúng tôi.

  • Trả về kết quả tốt nhất

    Trả về kết quả tốt nhất

    Trước khi cung cấp cho bạn kết quả, chúng tôi đánh giá xem tất cả các thông tin liên quan đến nhau như thế nào: liệu chỉ có một chủ đề duy nhất trong kết quả tìm kiếm hay có nhiều chủ đề? Có phải có quá nhiều trang tập trung vào một cách diễn giải hời hợt? Chúng tôi cố gắng cung cấp thông tin đa dạng bằng các định dạng hữu ích nhất cho loại tìm kiếm của bạn. Và khi web phát triển, chúng tôi cũng phát triển hệ thống xếp hạng của mình để cung cấp kết quả tốt hơn cho nhiều truy vấn hơn.

  • Xem xét bối cảnh

    Xem xét bối cảnh

    Các thông tin chẳng hạn như vị trí của bạn, lịch sử tìm kiếm và cài đặt Tìm kiếm đều giúp chúng tôi tùy chỉnh kết quả cho phù hợp và hữu ích với bạn nhất trong khoảnh khắc đó.

    Chúng tôi sử dụng quốc gia và vị trí của bạn để cung cấp nội dung thích hợp với khu vực của bạn. Ví dụ: nếu bạn ở Chicago và tìm "bóng đá", Google có thể sẽ hiển thị cho bạn kết quả về môn bóng đá Mỹ và câu lạc bộ Chicago Bears trước tiên. Ngược lại, nếu bạn tìm "bóng đá" ở Luân Đôn, Google sẽ xếp hạng các kết quả về bóng đá và giải Premier League cao hơn. Cài đặt Tìm kiếm cũng là một chỉ báo quan trọng về việc bạn có khả năng thấy kết quả nào hữu ích, chẳng hạn như liệu bạn có thiết lập một ngôn ngữ ưu tiên hay chọn tham gia Tìm kiếm an toàn (một công cụ giúp lọc các kết quả không phù hợp) hay không.

    Trong một số trường hợp, chúng tôi cũng có thể cá nhân hóa kết quả cho bạn dựa trên thông tin về hoạt động Tìm kiếm gần đây của bạn. Ví dụ: nếu bạn tìm "Barcelona" và gần đây đã tìm "Barcelona đấu với Arsenal", đó có thể là một gợi ý quan trọng cho biết bạn muốn thông tin về câu lạc bộ bóng đá chứ không phải thành phố. Bạn có thể kiểm soát hoạt động tìm kiếm nào được sử dụng để cải thiện trải nghiệm Tìm kiếm, bao gồm điều chỉnh việc dữ liệu nào được lưu vào tài khoản Google của mình, tại myaccount.google.com.