2.5 Suche

Die Picturepark Suche bietet 3 Suchmodi, sowie SuchvorschlƤge aus den Listeneinstellungen.
Wann welcher Suchmodus zu verwenden ist, wird unten erklƤrt.

AND Suche

Die AND Suche sucht nach Inhalten, die alle eingegebenen Suchbegriffe enthalten. Wenn Sie zum Beispiel nach ā€œStock shotā€ suchen, Ć¼bersetzt Picturepark dies in Stock AND shot und sucht nach Bildern, die diese beiden Werte enthalten.

OR Suche

Bei Verwendung der OR Suche Ć¼bersetzt die Picturepark Suche den Suchbegriff ā€œStock Shotā€ in ā€œStock OR Shotā€ und sucht nach Inhalten, die einen oder mehrere eingegebene Suchbegriffe enthalten.

Erweiterte Suche

Der Picturepark erlaubt eine Vielzahl von exakten, Fuzzy oder ersetzenden Suchen. Sie kƶnnen auf das Cheat Sheet der erweiterten Suche mit den Beispielen unten zugreifen. Diese Suchanfragen funktionieren nur im ā€œAdvanced Modeā€. Diese Suchabfragen erlauben es nach spezifischen Werten in spezifischen Feldern zu suchen auf spezifischen layern. ƜberprĆ¼fen Sie die individuelle syntax pro Feld.

Simple Search Analyzer

Suchanalyzer legen fest, wie Text verarbeitet oder manipuliert wird. Diese Analyzer geben Ihnen die Kontrolle darĆ¼ber, wie Ihre Textdaten in der Suche verwendet werden. Ziel ist es, Text zu standardisieren, z. B. Kleinschreibung oder Umwandlung von Sonderzeichen (Diakritika) oder Behandlung von Singular/Plural in Ɯbersetzungen (z. B. MƤnner, Mann). Search Analyzers sind fĆ¼r String- und Ć¼bersetzte String-Felder verfĆ¼gbar.

Simple Search Analyzer

Ā Zugriff in Suchanfragen: simple

Der Simple Search Analyzer ist eine benutzerdefinierte Picturepark-Implementation, die keine Elastic-Suchvorgaben verwendet. Der Custom Analyzer verwendet eine Regex:

  • Regex

    */"(\[^\\p\{L\}\\d\]+)|(?<=\\D)(?=\\d)|(?<=\\d)(?=\\D)|(?<=\[\\p\{L\}&&\[^\\p\{Lu\}\]\])(?=\\p\{Lu\})|(?<=\\p\{Lu\})(?=\\p\{Lu\}\[\\p\{L\}&&\[^\\p\{Lu\}\]\])"/*
  • Ergebnis:

    • Kleinbuchstaben/GroƟbuchstaben

    • Ziffern / Nicht-Ziffern

    • Stemming

    • HTML-Streifen

  • Beispiele

    • Picturepark = Picturepark, picturepark

    • Case Study = Case, Study, case, study

Wenn Sie den einfachen Suchanalysator testen mƶchten, kƶnnen Sie Ihre Begriffe in einem Regex-Tester Ć¼berprĆ¼fen, um das Ergebnis zu sehen.

  1. Ɩffnen Sie einen regex checker

    1. regex101: build, test, and debug regex

    2. RegExr: Learn, Build, & Test RegEx

  2. FĆ¼gen Sie Ihren Begriff als PrĆ¼fzeichenfolge hinzu

  3. ƜberprĆ¼fen Sie das Resultat

No Diacritics Analyzer

Ā Zugriff in Suchanfragen: no-diacritics

Der no diacritics analyzer:

  • funktioniert nur bei Textfeldern

  • diakritische Zeichen werden entfernt, wenn also der Textwert lautet: Kovačić Mateo kƶnnen Sie nach "Kovačić Mateo" oder "Kovacic Mateo" suchen.

Ein Beispiel finden Sie in der Elastic Search Dokumentation:Ā https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-asciifolding-tokenfilter.html

Path Hierarchy Analyzer

Ā Zugriff in Suchanfragen:Ā pathHierarchy

Der path hierarchy analyzer:

  • Nimmt einen in einem Feld gefundenen Pfad (picturepark\platform\manual) und grenzt die einzelnen Begriffe ab

  • Beispiel

    • picturepark\platform\manual = picturepark\platform\manual, picturepark\platform, manual

    • Products/Family/Industry = Products/Family, Products, Products/Family/Industry

Sie sollten diesen Analyzer nur konfigurieren, wenn er Ć¼ber die API verwendet wird. Bei der einfachen Suche in Picturepark werden Sonderzeichen umgangen, so dass Sie bei der Suche nach einigen der von diesem Analyzer generierten Token keine Assets finden werden.
Ein Beispiel finden Sie in der Elastic Search Dokumentation:https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-pathhierarchy-tokenizer.html

Language Analyzer

Ā Zugriff in Suchanfragen:Ā language

FĆ¼r die elastische Suche gibt es mehrere Sprachanalysatoren. Sprachanalysatoren verhindern das Stemming aus sprachspezifischen Werten und sprachspezifischen Stoppwƶrtern.
https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-lang-analyzer.html
Die aktuelle Implementierung verwendet die Standard-Analysatoren von Elastic Search Language, wie im Link aufgefĆ¼hrt. Wir verwenden die Standard-Stoppwƶrter und -Regeln fĆ¼r das Stemming, ohne eigene Anpassungen.

Ngram Analyzer

Ā Ā Zugriff in Suchanfragen:Ā ngram

Ausgangspunkt fĆ¼r exakte Teilstring-Ɯbereinstimmungen war die ngram-Tokenisierung, die alle Teilstrings bis zur LƤnge n indiziert. Der Nachteil der ngram-Tokenisierung ist der groƟe Speicherplatzbedarf.

Best practice:

  • ngram nur bei Bedarf verwenden - vorsichtig und nicht fĆ¼r jede Zeichenfolge verwenden

Die Einstellungen erlauben es, min und max Gramm zu definieren, die bei der Indizierung erstellt werden, und token_chars, die Zeichenklassen, die in den Token beibehalten werden sollen, Elasticsearch splittet auf Zeichen, die zu keiner dieser Klassen gehƶren. Beispiel: Suche "Raven"
Beispiel: Suche "Raven"

  • NGrams (splits term into tokens with one character):

  • Rav

  • Rave

  • Raven

  • ave

  • aven

  • Ven

  • ...

Beispiel: Suche "Pegasus"

  • NGrams (zerlegt den Begriff in Token mit einem Zeichen):

  • Pegasus

  • Degas

Beispiele finden Sie in der Elastic Search Dokumentation:
https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-ngram-tokenizer.html

Edge NGram Analyzer

Ā Zugriff in Suchanfragen:Ā edgeNGram

Dieser Tokenizer ist nGram sehr Ƥhnlich, behƤlt aber nur n-Gramme, die am Anfang eines Tokens beginnen. In den Einstellungen kƶnnen die bei der Indizierung erstellten Minimal- und Maximal-Gramme sowie die Zeichenklassen token_chars festgelegt werden, die in den Token beibehalten werden sollen; Elasticsearch teilt die Zeichen auf, die keiner dieser Klassen angehƶren.

Beispiele finden Sie in der Elastic Search Dokumentation:
https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-edgengram-tokenizer.html

Bei erweiterten Suchabfragen nach analysierten Feldern kann die Abfrage so angepasst werden, dass der Analysator berĆ¼cksichtigt wird.