1 <sect1 id="zend.search.lucene.searching">
2 <title>Het doorzoeken van een index</title>
4 <sect2 id="zend.search.lucene.searching.query-parser">
5 <title>Opbouwen van Queries</title>
8 Er zijn twee manieren om door een index te zoeken. De eerste methode gebruikt de Query Parser om een query op te bouwen van een string. De tweede bied de mogelijkheid je eigen queries te maken via de Zend_Search_Lucene API.
12 Alvorens te kiezen voor de aangeboden Query Parser, hou het volgende in gedachte:
17 Wanneer je query string door je applicatie wordt opgebouwd dan moet je serieus overwegen om je queries op te bouwen met de query API. Met andere woorden: De query parser is bedoeld voor door mensen ingevoerde tekst, niet voor applicatie-gerelateerde tekst.
22 Untokenized velden worden het best direct aan queries toegevoegd, en niet via de query parser. Wanneerde waarde van een veld via een applicatie wordt gegenereerd, dan dienen de query clases ook op die manier tot stand te komen voor dit veld.
23 De query parser gebruikt een analyzer om door mensen ingegeven strings to converteren van tekst naar termen. Waardes gegenereerd door een programma, zoals data, trefwoorden, etc. dienen consistent door het programma gegenereerd te worden.
28 In een query formulier dienen velden die over het algemeen tekst bevatten de query parser te gebruiken. Alle andere velden, zoals datum ranges, trefwoorden etc. kunnen het beste direct via de query API worden toegevoegd. Een veld met een gelimiteerde set van waarden, die kan worden geselecteerd via een pull-down menu, horen niet via een query string toegevoegd en geparsed worden, maar via een TermQuery clausule.
36 Beide manieren gebruiken dezelfde API methode om door de index te zoeken:
38 <programlisting role="php"><![CDATA[<?php
40 require_once('Zend/Search/Lucene.php');
42 $index = new Zend_Search_Lucene('/data/my_index');
46 ?>]]></programlisting>
48 De <code>Zend_Search_Lucene::find()</code> methode herkent automatisch het invoer type en gebruikt de query parser om het juiste Zend_Search_Lucene_Search_Query object
49 van een string te maken.
53 Het is belangrijk om te zien dat <code>find()</code> case sensitive is. Standaard normaliseert LuceneIndexCreation.jar alle documenten naar kleine letters. Dit kan uitgezet worden met een command line switch (type LuceneIndexCreation.jar zonder argumenten voor hulp). De case van de tekst die aan <code>find()</code> wordt doorgegeven moet overeenkomen met die in de index. Als de index is genormaliseerd naar kleine letters, dan dient alle tekst die aan <code>find()</code> wordt doorgegeven worden onderworpen aan <code>strtolower()</code>, anders worden mogelijk geen resultaten gevonden.
57 <sect2 id="zend.search.lucene.searching.results">
58 <title>Zoek resultaten</title>
60 Het zoek resultaat is een array van Zend_Search_Lucene_Search_QueryHit objecten. Ieder van deze objecten heeft twee eigenschappen: <code>$hit->document</code> is een documentnummer binnen de index en <code>$hit->score</code> is een score van het resultaat binnen het volledige zoekresultaat. Resultaat wordt geordend op score (hoogste score komt eerst).
64 Het Zend_Search_Lucene_Search_QueryHit object bied daarnaast ook ieder veld van het gevonden Zend_Search_Lucene_Document als een eigenschap. In het volgende voorbeeld wordt een resultaat teruggegeven en heeft het document twee velden: title en author.
66 <programlisting role="php"><![CDATA[<?php
68 require_once('Zend/Search/Lucene.php');
70 $index = new Zend_Search_Lucene('/data/my_index');
72 $hits = $index->find($query);
74 foreach ($hits as $hit) {
82 ?>]]></programlisting>
85 Het originele Zend_Search_Lucene_Document object kan ook worden teruggegeven vanuit de Zend_Search_Lucene_Search_QueryHit.
87 Je kan opgeslagen delen van het document verkrijgen door gebruik te maken van de <code>getDocument()</code>methode van het index object en dan de <code>getFieldValue()</code> methode te gebruiken:
89 <programlisting role="php"><![CDATA[<?php
91 require_once('Zend/Search/Lucene.php');
93 $index = new Zend_Search_Lucene('/data/my_index');
95 $hits = $index->find($query);
96 foreach ($hits as $hit) {
97 // geef een Zend_Search_Lucene_Document object terug voor dit resultaat
98 echo $document = $hit->getDocument();
100 // geef een Zend_Search_Lucene_Field object terug
101 // uit het Zend_Search_Lucene_Document
102 echo $document->getField('title');
104 // geef de string waarde terug van een Zend_Search_Lucene_Field object
105 echo $document->getFieldValue('title');
107 // hetzelfde als getFieldValue()
108 echo $document->title;
111 ?>]]></programlisting>
113 De velden die beschikbaar zijn via het Zend_Search_Lucene_Document object worden besloten tijdens het indexeren. De document velden worden ofwel geindexeerd, ofwel geindexeerd en opgeslagen, in het document door de indexeringsapplicatie (bijvoorbeeld LuceneIndexCreation.jar).
117 Let op dat de document identiteit ('path' in het voorbeeld) ook wordt opgeslagen in de index en vanuit de index opgehaald dient te worden.
123 <sect2 id="zend.search.lucene.searching.results-scoring">
124 <title>Resultaten Scoring</title>
126 Zend_Search_Lucene gebruikt hetzelfde score algoritme als Java Lucene.
127 Zoek resultaten worden geordend op score, met de hoogste score als eerst.
131 Een verschillende score betekent dat een document meer overeenkomt met de zoekopdracht dan de andere.
135 Ruwweg genomen wordt de zoekopdracht vaker gevonden in documenten met een hogere score dan in documenten met een lagere score.
139 Score kan worden verkregen via de <code>score</code> eigenschap van het resultaat:
141 <programlisting role="php"><![CDATA[<?php
142 $hits = $index->find($query);
144 foreach ($hits as $hit) {
149 ?>]]></programlisting>
152 Zend_Search_Lucene_Search_Similarity klasse wordt gebruikt om de score te berekenen. Zie <link linkend="zend.search.lucene.extending.scoring">Uitbreidbaarheid. Scoring Algoritmes</link> sectie voor details.