Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

Filter by label (Content by label)
showLabelsfalse
max50
cqllabel in ( "advanced-search" , "search" ) and space = "SOL"

Simple Search Analyzer

...

Suchanalyzer legen fest, wie Text verarbeitet oder manipuliert wird. Diese Analyzer geben Ihnen die Kontrolle darüber, wie Ihre Textdaten in der Suche verwendet werden. Ziel ist es, Text zu standardisieren, z. B. Kleinschreibung oder Umwandlung von Sonderzeichen (Diakritika) oder Behandlung von Singular/Plural in Übersetzungen (z. B. Männer, Mann). Search Analyzers sind für String- und übersetzte String-Felder verfügbar.

Expand
titleSimple Search Analyzer

Simple Search Analyzer

(info) access  Zugriff in search queriesSuchanfragen:  simpleThe simple search analyzer is a custom Picturepark implementation not using Elastic search defaults. The custom analyzer uses a regexsimple

Der Simple Search Analyzer ist eine benutzerdefinierte Picturepark-Implementation, die keine Elastic-Suchvorgaben verwendet. Der Custom Analyzer verwendet eine Regex:

  • Regex

    Code Block
    */"(\[^\\p\{L\}\\d\]+)|(?<=\\D)(?=\\d)|(?<=\\d)(?=\\D)|(?<=\[\\p\{L\}&&\[^\\p\{Lu\}\]\])(?=\\p\{Lu\})|(?<=\\p\{Lu\})(?=\\p\{Lu\}\[\\p\{L\}&&\[^\\p\{Lu\}\]\])"/*
  • OutcomeErgebnis:

    • Lowercase Kleinbuchstaben/ UppercaseGroßbuchstaben

    • Digit Ziffern / nonNicht-digitZiffern

    • Stemming

    • HTML Strip-Streifen

  • ExamplesBeispiele

    • Picturepark = Picturepark, picturepark

    • Case Study = Case, Study, case, study

If you want to test the simple search analyzer, you can check your terms in a regex tester to see the outcome.

Open a

Wenn Sie den einfachen Suchanalysator testen möchten, können Sie Ihre Begriffe in einem Regex-Tester überprüfen, um das Ergebnis zu sehen.

  1. Öffnen Sie einen regex checker

    1. https://regex101.com/

    2. https://regexr.com/

  2. Add your term as a test string

  3. Check the outcomeFügen Sie Ihren Begriff als Prüfzeichenfolge hinzu

  4. Überprüfen Sie das Resultat

Expand
titleNo Diacritics Analyzer

No Diacritics Analyzer

(info) access  Zugriff in search queriesSuchanfragen:  nono-diacritics

The no Der no diacritics analyzer:

  • only works for text fields

  • strip diacritic characters, so when the text value is: Kovačić Mateo you can search for “Kovačić Mateo” or “Kovacic Mateo”.

An example can be found in Elastic Search Documentation
  • funktioniert nur bei Textfeldern

  • diakritische Zeichen werden entfernt, wenn also der Textwert lautet: Kovačić Mateo können Sie nach "Kovačić Mateo" oder "Kovacic Mateo" suchen.

Ein Beispiel finden Sie in der Elastic Search Dokumentationhttps://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-asciifolding-tokenfilter.html

Expand
titlePath Hierarchy Analyzer

Path Hierarchy Analyzer

(info) access  Zugriff in search queriesSuchanfragen: pathHierarchy

The Der path hierarchy analyzer will:

  • Take a path found in a field Nimmt einen in einem Feld gefundenen Pfad (picturepark\platform\manual) and delimit the individual termsExampleund grenzt die einzelnen Begriffe ab

  • Beispiel

    • picturepark\platform\manual = picturepark\platform\manual, picturepark\platform, manual

    • Products/Family/Industry = Products/Family, Products, Products/Family/Industry

You should only configure this analyzer if being used via API. The simple search in Picturepark escapes Special Characters, and therefore you won't find assets when searching for some of the tokens generated by this analyzer.
An example can be found in Elastic Search DocumentationSie sollten diesen Analyzer nur konfigurieren, wenn er über die API verwendet wird. Bei der einfachen Suche in Picturepark werden Sonderzeichen umgangen, so dass Sie bei der Suche nach einigen der von diesem Analyzer generierten Token keine Assets finden werden.
Ein Beispiel finden Sie in der Elastic Search Dokumentation:https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-pathhierarchy-tokenizer.html

Expand
titleLanguage Analyzer

Language Analyzer

(info) access  Zugriff in search queriesSuchanfragen: language

There are several language analyzers available for elastic search. Language analyzers prevent stemming from language-specific values and language-specific stopwordsFür die elastische Suche gibt es mehrere Sprachanalysatoren. Sprachanalysatoren verhindern das Stemming aus sprachspezifischen Werten und sprachspezifischen Stoppwörtern.
https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-lang-analyzer.html
The current implementation is using the default Elastic Search Language analyzers as listed in the link. We are using the default stop words and rules for stemming, without any custom adaptionDie aktuelle Implementierung verwendet die Standard-Analysatoren von Elastic Search Language, wie im Link aufgeführt. Wir verwenden die Standard-Stoppwörter und -Regeln für das Stemming, ohne eigene Anpassungen.

Expand
titleNgram Analyzer

Ngram Analyzer

(info) access   Zugriff in search queriesSuchanfragen: ngram

Starting point for exact substring matches was ngram tokenizing, which indexes all the substrings up to length n. The drawback of ngram tokenizing is a large amount of disk space usedAusgangspunkt für exakte Teilstring-Übereinstimmungen war die ngram-Tokenisierung, die alle Teilstrings bis zur Länge n indiziert. Der Nachteil der ngram-Tokenisierung ist der große Speicherplatzbedarf.

Best practice:

  • Use ngram only if required - use carefully and not for every string

Settings allow to define min and max grams created on indexing and token_chars, which are characters classes to keep in the tokens, Elasticsearch splits on characters that don't belong to any of these classes.
Example: Search
  • ngram nur bei Bedarf verwenden - vorsichtig und nicht für jede Zeichenfolge verwenden

Die Einstellungen erlauben es, min und max Gramm zu definieren, die bei der Indizierung erstellt werden, und token_chars, die Zeichenklassen, die in den Token beibehalten werden sollen, Elasticsearch splittet auf Zeichen, die zu keiner dieser Klassen gehören. Beispiel: Suche "Raven"
Beispiel: Suche "Raven"

  • NGrams (splits term into tokens with one character):

  • Rav

  • Rave

  • Raven

  • ave

  • aven

  • Ven

  • ...

ExampleBeispiel: Search Suche "Pegasus"

  • NGrams (splits term into tokens with one characterzerlegt den Begriff in Token mit einem Zeichen):

  • Pegasus

  • Degas

Examples are Beispiele finden Sie in der Elastic Search DocumentationDokumentation:
https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-ngram-tokenizer.html

Expand
titleEdge NGram Analyzer

Edge NGram Analyzer

(info) access  Zugriff in search queriesSuchanfragen: edgeNGram

This tokenizer is very similar to nGram but only keeps n-grams that start at the beginning of a token. Settings allow to define min and max grams created on indexing and token_chars, which are characters classes to keep in the tokens, Elasticsearch splits on characters that don't belong to any of these classes.

Examples are in Elastic Search DocumentationDieser Tokenizer ist nGram sehr ähnlich, behält aber nur n-Gramme, die am Anfang eines Tokens beginnen. In den Einstellungen können die bei der Indizierung erstellten Minimal- und Maximal-Gramme sowie die Zeichenklassen token_chars festgelegt werden, die in den Token beibehalten werden sollen; Elasticsearch teilt die Zeichen auf, die keiner dieser Klassen angehören.

Beispiele finden Sie in der Elastic Search Dokumentation:
https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-edgengram-tokenizer.html

Expand
titleUseful Links to ElasticSearch Documentation
Useful

Nützliche Links in der ElasticSearch

Documentation

-Dokumentation

Simple Analyzer: https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-simple-analyzer.html

No Diacritics:  https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-asciifolding-tokenfilter.html

Path Hierarchy: https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-pathhierarchy-tokenizer.html

Language: https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-lang-analyzer.html

NGram: https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-ngram-tokenizer.html

EdgeNgram: https://www.elastic.co/guide/en/elasticsearch/reference/7.6/analysis-edgengram-tokenizer.html

For advanced search queries on analyzed fields, the query can be adjusted to consider the analyzer. Bei erweiterten Suchabfragen nach analysierten Feldern kann die Abfrage so angepasst werden, dass der Analysator berücksichtigt wird.

Filter by label (Content by label)
showLabelsfalse
max50
cqllabel = "advanced-search" and label = "analyzer" and space = "SOL"