नतीजे अपने-आप कैसे जनरेट होते हैं
वेब पर मौजूद बेशुमार कॉन्टेंट को देखते हुए, अपनी ज़रूरत की जानकारी खोज पाना करीब-करीब नामुमकिन है, यदि इन्हे छांटने में कोई मदद न मिले. Google के रैंकिंग सिस्टम इसी काम के लिए बनाए गए हैं: ये सिस्टम हमारे Search इंडेक्स में मौजूद सैकड़ों अरबों वेबपेजों को क्रम से लगाते हैं, ताकि आपको काम के और फ़ायदेमंद नतीजे झटपट मिल सकें.
खोज बार, जिसमें "मेरे आस-पास के हेयर सैलून" क्वेरी दिख रही है
नतीजों पर असर डालने वाले खास फ़ैक्टर
आपको सबसे ज़्यादा काम की जानकारी देने के लिए, Search के एल्गोरिदम कई फ़ैक्टर और सिग्नल पर ध्यान देते हैं. इनमें आपकी क्वेरी के शब्द, पेजों का काम का और ज़रूरत के मुताबिक होना, स्रोतों की विशेषज्ञता के साथ आपकी जगह की जानकारी और सेटिंग शामिल हैं. हर फ़ैक्टर की अहमियत, क्वेरी के हिसाब से अलग-अलग होती है. जैसे, शब्दकोश परिभाषाओं की क्वेरी के मुकाबले, ताज़ा खबरों की क्वेरी का जवाब देते समय, यह बात ज़्यादा मायने रखती है कि कॉन्टेंट कितना नया है.
उन खास फ़ैक्टर के बारे में यहां ज़्यादा जानें जिनसे आपकी क्वेरी के लिए मिलने वाले नतीजे तय होते हैं:
आपकी क्वेरी का मतलब समझना

काम के नतीजे दिखाने के लिए, आपकी खोज का मतलब यानी आपकी क्वेरी का मकसद समझना ज़रूरी है. इसलिए, हम भाषा के मॉडल बनाकर यह समझने की कोशिश करते हैं कि खोज बॉक्स में आपने जो शब्द डाले हैं वे सबसे काम के कॉन्टेंट से किस तरह मिलते-जुलते हैं.

इसमें आसान लगने वाले कई कदम शामिल हैं, जैसे कि किसी शब्द को लिखने में हुई गलती (वर्तनी की गलती) को समझना और उसमें सुधार करना. मिलते-जुलते शब्दों का मतलब समझने वाले हमारे बेहतरीन सिस्टम, काम के दस्तावेज़ खोजने में हमारी तब भी मदद करते हैं, जब आपने अपनी खोज में सटीक शब्दों का इस्तेमाल न किया हो. उदाहरण के लिए, हो सकता है कि आपने "लैपटॉप की रोशनी बदलें" खोजा हो, लेकिन लैपटॉप बनाने वाली कंपनी ने "लैपटॉप की रोशनी एडजस्ट करें" लिखा हो. हमारे सिस्टम शब्द और उनका मकसद समझते हैं और आप तक सही कॉन्टेंट पहुंचाते हैं. इस सिस्टम को बनाने में पांच साल से ज़्यादा लगे हैं. इसने सभी भाषाओं में खोज के नतीजों को 30% से ज़्यादा बेहतर किया है.

हमारे सिस्टम यह भी समझने की कोशिश करते हैं कि आप किस तरह की जानकारी खोज रहे हैं. अगर आपने अपनी क्वेरी में "खाना पकाना" या "तस्वीरें" जैसे शब्दों का इस्तेमाल किया है, तो हमारे सिस्टम पता लगाते हैं कि रेसिपी या इमेज दिखाना आपके मकसद से सबसे अच्छा मेल खा सकता है. अगर आप फ़्रेंच भाषा में कोई खोज करते हैं, तो जैसा कि आप चाहते हैं, आपको दिखने वाले ज़्यादातर नतीजे फ़्रेंच भाषा में ही होंगे. हमारे सिस्टम यह भी पहचान सकते हैं कि कई क्वेरी का स्थानीय मकसद होता है, ताकि जब आप "पिज़्ज़ा" खोजते हैं, तो आपको आस-पास के कारोबार के बारे में नतीजे मिलते हैं जो पिज़्ज़ा की डिलीवरी देते हैं. अगर आप ऐसे कीवर्ड खोजते हैं जो रुझान में है, तो हमारे सिस्टम यह बात समझते हैं कि पुराने पेज दिखाने के बजाय, बिल्कुल नई जानकारी दिखाना ज़्यादा फ़ायदेमंद हो सकता है. इसका मतलब यह है कि जब आप खेल-कूद से जुड़े स्कोर, कंपनी का मुनाफ़ा या कुछ ऐसा खोजते हैं जो खास तौर पर नया होना चाहिए, तो आपको नई जानकारी दिखेगी.
Relevance of content

इसके बाद, हमारे सिस्टम यह देखने के लिए कॉन्टेंट का आकलन करते हैं कि वह आपकी खोज के हिसाब से है या नहीं.

काम की जानकारी की सबसे बड़ी पहचान यह है कि कॉन्टेंट में वही कीवर्ड होने चाहिए जो आपकी खोज क्वेरी में हैं. उदाहरण के लिए, वेबपेजों के साथ, अगर खोज क्वेरी में मौजूद कीवर्ड, पेज पर या हेडिंग में या टेक्स्ट के तौर पर दिखते हैं, तो जानकारी काम की हो सकती है.

किसी वेबसाइट की मैग्नीफ़ाइंग ग्लास से जांच की जा रही है

कॉन्टेंट में मौजूद कीवर्ड देखने के अलावा, हमारे सिस्टम इस बात का भी आकलन करते हैं कि कॉन्टेंट दूसरे तरीकों से किसी क्वेरी से जुड़ा है या नहीं. खोज के नतीजे क्वेरी के हिसाब से हैं या नहीं, यह पता लगाने के लिए कीवर्ड का मिलान करने के बजाय, हम इकट्ठा किए गए और पहचान छिपाकर इस्तेमाल किए गए इंटरैक्शन डेटा का भी इस्तेमाल करते हैं. हम उस डेटा को सिग्नल में बदलते हैं, ताकि मशीन से सीखने वाले हमारे सिस्टम, काम की जानकारी का बेहतर अनुमान लगा सकें. ज़रा सोचिए: जब आप “कुत्तों” के बारे में खोजते हैं, तो शायद आप कोई ऐसा पेज नहीं देखना चाहेंगे जिस पर सैंकड़ों बार “कुत्ता” शब्द लिखा हो. इसे ध्यान में रखते हुए, एल्गोरिदम यह आकलन करते हैं कि क्या किसी पेज में, “कुत्ता” कीवर्ड से जुड़ा दूसरा कॉन्टेंट मौजूद है — जैसे कुत्तों की तस्वीरें, वीडियो या कुत्तों की नस्लों की सूची.

यह ध्यान में रखना ज़रूरी है कि भले ही हमारा सिस्टम जानकारी का पता लगाने के लिए, इस तरह के आकलन किए जा सकने वाले सिग्नल का पता लगाता है, लेकिन उन्हें विषय से जुड़े सिद्धांतों, जैसे कि पेज के कॉन्टेंट का नज़रिया या राजनीतिक झुकाव का विश्लेषण करने के लिए डिज़ाइन नहीं किया गया है.

कॉन्टेंट की क्वालिटी

क्वेरी के हिसाब से सही कॉन्टेंट की पहचान करने के बाद, हमारे सिस्टम ऐसे कॉन्टेंट को प्राथमिकता देते हैं जो सबसे ज़्यादा सही लगते हैं. इसके लिए हमारे सिस्टम, सिग्नल की पहचान करते हैं. इससे यह पता करने में मदद मिलती है कि कौनसे कॉन्टेंट में अच्छी समझ (एक्सपर्टीज़), प्रामाणिकता (अथॉरिटेटिवनेस), और विश्वसनीयता (ट्रस्टवर्दीनेस) झलकती है.

उदाहरण के लिए, कॉन्टेंट की क्वालिटी का आकलन करने के लिए कई फ़ैक्टर में से एक यह है कि अगर उसी विषय से जुड़ी दूसरी खास वेबसाइट भी पेज का लिंक देती है, तो इसका मतलब है कि जानकारी की क्वालिटी अच्छी है. यह अक्सर इस बात की अच्छी पहचान साबित हुई है कि जानकारी पर भरोसा किया जा सकता है. Search की क्वालिटी के आकलन की प्रोसेस से इकट्ठे किए गए फ़ीडबैक का इस्तेमाल करके, यह कोशिश की जाती है कि हम अपने सिस्टम को जानकारी की क्वालिटी समझने के लिए और ज़्यादा बेहतर बना सकें.

एल्गोरिदम से वेबसाइट का विश्लेषण किया जा रहा है

वेब पर मौजूद कॉन्टेंट और जानकारी का बड़ा इकोसिस्टम लगातार बदल रहा है. हम अपने सिस्टम की क्वालिटी की लगातार जांच करते हैं और इसका मूल्यांकन करते हैं. हम ऐसा इसलिए करते हैं, ताकि यह पक्का कर सकें कि हम जो जानकारी आपको दे रहे हैं वह काम की हो. साथ ही, हमारी कोशिश है कि हम आपको बेहतर नतीजे दें, जिससे हमारे ऊपर आपका भरोसा बना रहे.
वेबपेजों की उपयोगिता

हमारे सिस्टम, कॉन्टेंट की उपयोगिता का भी ध्यान रखते हैं. जब दूसरी सभी चीज़ें एक जैसी हों, तो लोगों को आसानी से मिलने वाले कॉन्टेंट से बेहतर परफ़ॉर्मेंस मिल सकती है.

उदाहरण के लिए, हमारे सिस्टम पेज की परफ़ॉर्मेंस से जुड़े पहलुओं की जांच करते हैं. जैसे, सिस्टम यह जांच करते हैं कि कॉन्टेंट मोबाइल-फ़्रेंडली है या नहीं, ताकि लोग उसे मोबाइल डिवाइस पर आसानी से देख सकें. इसी तरह, वे यह भी देखते हैं कॉन्टेंट तेज़ी से लोड होता है या नहीं, जो कि मोबाइल उपयोगकर्ताओं के लिए भी ज़रूरी है.

गोल्ड बैज वाली वेबसाइट

संदर्भ पर विचार और सेटिंग

आपकी जगह, Search का पहले का इतिहास और Search की सेटिंग जैसी जानकारी से हमें आपकी खोज से जुड़े नतीजे दिखाने में मदद मिलती है. इनकी मदद से, हम आपकी खोज से जुड़े ऐसे नतीजे दिखा सकते हैं जो उस समय आपके लिए सबसे ज़रूरी और काम के हो सकते हैं.

हम आपके इलाके के हिसाब से जुड़ा कॉन्टेंट आपको दिखाने के लिए, आपके देश और जगह की जानकारी का इस्तेमाल करते हैं. उदाहरण के लिए, अगर आप शिकागो में हैं और आप “फ़ुटबॉल” खोजते हैं, तो इस बात की उम्मीद ज़्यादा है कि Google आपको अमेरिकी फ़ुटबॉल से जुड़े नतीजे दिखाए और उसमें शिकागो बियर्स के बारे में पहले बताया जाए. जबकि, अगर आप लंदन में “फ़ुटबॉल” खोजते हैं, तो Google, सॉकर और प्रीमियर लीग से जुड़े नतीजे दिखाएगा. Search की सेटिंग से यह भी पता चलता है कि आपके लिए किस तरह के नतीजे फ़ायदेमंद हो सकते हैं. अगर आपने अपनी पसंदीदा भाषा सेट की है या सेफ़ सर्च (ऐसा टूल जो आपत्तिजनक नतीजे हटाने में मदद करता है) का विकल्प चुना हुआ है, तो दिखने वाले नतीजे अलग-अलग हो सकते हैं.

फ़ुटबाल और अमेरिकन फ़ुटबाल की जानकारी दिखाते हुए दो वेबसाइटें

Search में कुछ ऐसी सुविधाएं भी शामिल हैं जिनसे आपके Google खाते में होने वाली गतिविधि के आधार पर, नतीजों को आपकी पसंद के मुताबिक बनाया जाता है. उदाहरण के लिए, अगर आप “मेरे आस-पास के इवेंट” खोजते हैं, तो Google इवेंट की कैटगरी के मुताबिक, ऐसे सुझाव दे सकता है जो हमारे हिसाब से आपको पसंद हो सकते हैं.

ये सिस्टम इस तरह डिज़ाइन किए गए हैं, ताकि आपकी पसंद से मेल खा सकें. हालांकि, इन सिस्टम को आपकी जाति, धर्म या राजनीतिक दल जैसी संवेदनशील जानकारी का पता लगाने के लिए नहीं बनाया गया है.

आप Search इस्तेमाल करने के अपने अनुभव को बेहतर बनाने के लिए, इस्तेमाल की जाने वाली Search से जुड़ी गतिविधि को कंट्रोल कर सकते हैं. इसमें उस डेटा में बदलाव करना शामिल है जिसे आपके Google खाते में सेव किया जाता है. इस्तेमाल की जाने वाली गतिविधि को आप myaccount.google.com पर जाकर कंट्रोल कर सकते हैं. Search को अपने खाते की गतिविधि के आधार पर पसंद के मुताबिक बनाने की सुविधा बंद करने के लिए, वेब और ऐप्लिकेशन गतिविधि को बंद करें.

अपनी पसंद के मुताबिक कॉन्टेंट देखने के लिए, आप सेटिंग में जाकर सेफ़ सर्च जैसी सुविधा का इस्तेमाल कर सकते हैं. इससे आपको यह चुनने में मदद मिलती है कि खोज के नतीजों में दिल दहलाने वाला कॉन्टेंट शामिल हो या न हो. दिल दहलाने वाला कॉन्टेंट, कुछ उपयोगकर्ताओं के लिए चौंकाने वाला कॉन्टेंट साबित हो सकता है.