Google
搜尋如何彙整資訊
當你進行搜尋時,Google 會瀏覽搜尋索引中保存的數千億個網頁和其他內容,找出實用資訊。這部索引所含的資訊量超越全球所有圖書館的總和。
三人將卡片上的資訊排序
透過檢索來尋找資訊

搜尋索引中的大多數內容都是由名為檢索器的軟體收集而來。檢索器會自動前往開放大眾存取的網頁並追蹤其中的連結,這和使用者瀏覽網路內容的行為十分相像。這類軟體會逐一檢視各個網頁,判斷哪些資訊與網頁內容及其他開放大眾存取的內容相關,並將該資訊儲存在 Google 搜尋索引中。

顯示單車的網站
透過建立索引來管理資訊

檢索器找到網頁後,Google 的系統會像瀏覽器一樣顯示頁面內容。我們會特別留意重要信號 (例如關鍵字和網站更新情形),然後將所有資料記錄在搜尋索引中。

三組網站

Google 搜尋索引收錄了數千億個網頁,總計大小超過 100,000,000 GB。這就像是書末的索引;我們編製網頁的索引時,會為網頁中的每個字詞建立條目,之後每次為網頁建立索引,都會依據其中包含的字詞,將該網頁加入相對應的條目中。

持續檢索以找出新資訊

網頁和其他內容會不斷改變,因此我們必須隨時執行索引程序,以免遺漏任何內容。這類程序會偵測已知內容的變更頻率並視需要重新造訪網頁,也會在前所未見的網頁連結或資訊出現時發掘新的內容。

此外,Google 提供了免費的工具組 Search Console,讓創作者用於協助我們提升內容檢索效率。創作者也可依據公認的各項標準 (例如 Sitemaprobots.txt) 指出系統應該造訪網頁檢索內容的頻率,或者內容是否根本不該收錄在搜尋索引中。

Google 不接受以付費方式提高任何網站的檢索頻率;我們為所有網站提供完全相同的工具,目的是確保使用者能夠取得最符合需求的搜尋結果。

不只收錄網頁

Google 搜尋索引不只收錄網路內容,因為其他來源也可能提供實用的資訊。

事實上,我們擁有多部索引,分別彙整各類資訊,這些資訊的收集管道包括檢索作業、合作夥伴、Google 收到的資料動態饋給,以及我們的事實資訊百科全書:知識圖譜

透過為數眾多的索引,你可以搜尋各大圖書館中數百萬本書籍的內容、查詢當地大眾運輸公司的時刻表,也可尋找 World Bank 等公開來源的資料。