Lucene स्कोर परिणाम

वोट
37

Lucene में यदि आप कई अनुक्रमित है कि केवल एक विभाजन प्रत्येक कवर किया था। क्यों अलग अनुक्रमित पर समान खोज वापसी करता है अलग अलग स्कोर के साथ परिणाम? अलग सर्वर से परिणाम ठीक प्रकार से दिखाई।

यानी अगर मैं के लिए खोज:

  • नाम - जॉन स्मिथ
  • जन्म तिथि - 1934/11/11

विभाजन 0 0.345 के स्कोर वापसी होगी

विभाजन 1 0.337 के स्कोर वापसी होगी

दोनों नाम और जन्म तिथि पर ठीक प्रकार से दिखाई।

02/08/2008 को 10:28
का स्रोत उपयोगकर्ता
अन्य भाषाओं में...                            


3 जवाब

वोट
19

स्कोरिंग उलटा दस्तावेज़ आवृत्ति (आईडीएफ) शामिल हैं। अवधि "जॉन स्मिथ" एक विभाजन, 0, 100 बार में और विभाजन 1, एक बार में है। जॉन स्मिथ के लिए खोज विभाजन 1 में उच्च खोज होगा के रूप में अवधि अधिक दुर्लभ है के लिए स्कोर।

इस दौर के लिए आप सभी विभाजनों से अधिक किया जा रहा है अपने सूचकांक करना होगा सूख जाएगा, या आप आईडीएफ ओवरराइड करने के लिए की आवश्यकता होगी।

02/08/2008 को 10:51
का स्रोत उपयोगकर्ता

वोट
13

क्योंकि स्कोर सूचकांक पर निर्धारित किया जाता है, तो मैं पूरी तरह से गलत नहीं कर रहा हूँ।

आप अलग अलग अनुक्रमित (अधिक / कम या अलग डेटा अनुक्रमित किया गया था) है, तो स्कोर अलग होगा:

http://lucene.apache.org/core/3_6_0/scoring.html

(चेतावनी: शामिल गणित :-))

02/08/2008 को 10:52
का स्रोत उपयोगकर्ता

वोट
8

तुम भी के उत्पादन में रुचि हो सकती explain()विधि , और जिसके परिणामस्वरूप Explanationवस्तु है, जो आप कैसे चीजें जिस तरह से वे कर रहे हैं बनाए जाते हैं की एक विचार दे देंगे।

02/08/2008 को 21:03
का स्रोत उपयोगकर्ता

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more