Page Comparison

...

Filter by label (Content by label)

showLabels	false
max	50
cql	label in ( "advanced-search" , "search" ) and space = "SOL"

Simple Search Analyzer

...

Suchanalyzer legen fest, wie Text verarbeitet oder manipuliert wird. Diese Analyzer geben Ihnen die Kontrolle darüber, wie Ihre Textdaten in der Suche verwendet werden. Ziel ist es, Text zu standardisieren, z. B. Kleinschreibung oder Umwandlung von Sonderzeichen (Diakritika) oder Behandlung von Singular/Plural in Übersetzungen (z. B. Männer, Mann). Search Analyzers sind für String- und übersetzte String-Felder verfügbar.

Expand

title	Simple Search Analyzer

Simple Search Analyzer

access Zugriff in search queriesSuchanfragen: simpleThe simple search analyzer is a custom Picturepark implementation not using Elastic search defaults. The custom analyzer uses a regexsimple

Der Simple Search Analyzer ist eine benutzerdefinierte Picturepark-Implementation, die keine Elastic-Suchvorgaben verwendet. Der Custom Analyzer verwendet eine Regex:

Regex

Code Block
/"(\[^\\p\{L\}\\d\]+)\|(?<=\\D)(?=\\d)\|(?<=\\d)(?=\\D)\|(?<=\[\\p\{L\}&&\[^\\p\{Lu\}\]\])(?=\\p\{Lu\})\|(?<=\\p\{Lu\})(?=\\p\{Lu\}\[\\p\{L\}&&\[^\\p\{Lu\}\]\])"/

OutcomeErgebnis:
- Lowercase Kleinbuchstaben/ UppercaseGroßbuchstaben
- Digit Ziffern / nonNicht-digitZiffern
- Stemming
- HTML Strip-Streifen
ExamplesBeispiele
- Picturepark = Picturepark, picturepark
- Case Study = Case, Study, case, study

If you want to test the simple search analyzer, you can check your terms in a regex tester to see the outcome.

Open a

Wenn Sie den einfachen Suchanalysator testen möchten, können Sie Ihre Begriffe in einem Regex-Tester überprüfen, um das Ergebnis zu sehen.

Öffnen Sie einen regex checker
1. https://regex101.com/
2. https://regexr.com/
Add your term as a test string
Check the outcomeFügen Sie Ihren Begriff als Prüfzeichenfolge hinzu
Überprüfen Sie das Resultat

Expand

title	No Diacritics Analyzer

No Diacritics Analyzer

access Zugriff in search queriesSuchanfragen: nono-diacritics

The no Der no diacritics analyzer:

only works for text fields
strip diacritic characters, so when the text value is: Kovačić Mateo you can search for “Kovačić Mateo” or “Kovacic Mateo”.

An example can be found in Elastic Search Documentation

funktioniert nur bei Textfeldern
diakritische Zeichen werden entfernt, wenn also der Textwert lautet: Kovačić Mateo können Sie nach "Kovačić Mateo" oder "Kovacic Mateo" suchen.

Ein Beispiel finden Sie in der Elastic Search Dokumentation: https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-asciifolding-tokenfilter.html

Expand

title	Path Hierarchy Analyzer

Path Hierarchy Analyzer

access Zugriff in search queriesSuchanfragen: pathHierarchy

The Der path hierarchy analyzer will:

Take a path found in a field Nimmt einen in einem Feld gefundenen Pfad (picturepark\platform\manual) and delimit the individual termsExampleund grenzt die einzelnen Begriffe ab
Beispiel
- picturepark\platform\manual = picturepark\platform\manual, picturepark\platform, manual
- Products/Family/Industry = Products/Family, Products, Products/Family/Industry

You should only configure this analyzer if being used via API. The simple search in Picturepark escapes Special Characters, and therefore you won't find assets when searching for some of the tokens generated by this analyzer.
An example can be found in Elastic Search DocumentationSie sollten diesen Analyzer nur konfigurieren, wenn er über die API verwendet wird. Bei der einfachen Suche in Picturepark werden Sonderzeichen umgangen, so dass Sie bei der Suche nach einigen der von diesem Analyzer generierten Token keine Assets finden werden.
Ein Beispiel finden Sie in der Elastic Search Dokumentation:https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-pathhierarchy-tokenizer.html

Expand

title	Language Analyzer

Language Analyzer

access Zugriff in search queriesSuchanfragen: language

There are several language analyzers available for elastic search. Language analyzers prevent stemming from language-specific values and language-specific stopwordsFür die elastische Suche gibt es mehrere Sprachanalysatoren. Sprachanalysatoren verhindern das Stemming aus sprachspezifischen Werten und sprachspezifischen Stoppwörtern.
https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-lang-analyzer.html
The current implementation is using the default Elastic Search Language analyzers as listed in the link. We are using the default stop words and rules for stemming, without any custom adaptionDie aktuelle Implementierung verwendet die Standard-Analysatoren von Elastic Search Language, wie im Link aufgeführt. Wir verwenden die Standard-Stoppwörter und -Regeln für das Stemming, ohne eigene Anpassungen.

Expand

title	Ngram Analyzer

Ngram Analyzer

access Zugriff in search queriesSuchanfragen: ngram

Starting point for exact substring matches was ngram tokenizing, which indexes all the substrings up to length n. The drawback of ngram tokenizing is a large amount of disk space usedAusgangspunkt für exakte Teilstring-Übereinstimmungen war die ngram-Tokenisierung, die alle Teilstrings bis zur Länge n indiziert. Der Nachteil der ngram-Tokenisierung ist der große Speicherplatzbedarf.

Best practice:

Use ngram only if required - use carefully and not for every string

Settings allow to define min and max grams created on indexing and token_chars, which are characters classes to keep in the tokens, Elasticsearch splits on characters that don't belong to any of these classes.
Example: Search

ngram nur bei Bedarf verwenden - vorsichtig und nicht für jede Zeichenfolge verwenden

Die Einstellungen erlauben es, min und max Gramm zu definieren, die bei der Indizierung erstellt werden, und token_chars, die Zeichenklassen, die in den Token beibehalten werden sollen, Elasticsearch splittet auf Zeichen, die zu keiner dieser Klassen gehören. Beispiel: Suche "Raven"
Beispiel: Suche "Raven"

NGrams (splits term into tokens with one character):
Rav
Rave
Raven
ave
aven
Ven
...

ExampleBeispiel: Search Suche "Pegasus"

NGrams (splits term into tokens with one characterzerlegt den Begriff in Token mit einem Zeichen):
Pegasus
Degas

Examples are Beispiele finden Sie in der Elastic Search DocumentationDokumentation:
https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-ngram-tokenizer.html

Expand

title	Edge NGram Analyzer

Edge NGram Analyzer

access Zugriff in search queriesSuchanfragen: edgeNGram

This tokenizer is very similar to nGram but only keeps n-grams that start at the beginning of a token. Settings allow to define min and max grams created on indexing and token_chars, which are characters classes to keep in the tokens, Elasticsearch splits on characters that don't belong to any of these classes.

Examples are in Elastic Search DocumentationDieser Tokenizer ist nGram sehr ähnlich, behält aber nur n-Gramme, die am Anfang eines Tokens beginnen. In den Einstellungen können die bei der Indizierung erstellten Minimal- und Maximal-Gramme sowie die Zeichenklassen token_chars festgelegt werden, die in den Token beibehalten werden sollen; Elasticsearch teilt die Zeichen auf, die keiner dieser Klassen angehören.

Beispiele finden Sie in der Elastic Search Dokumentation:
https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-edgengram-tokenizer.html

Expand

title	Useful Links to ElasticSearch Documentation

Useful

Nützliche Links in der ElasticSearch

Documentation

-Dokumentation

Simple Analyzer: https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-simple-analyzer.html

No Diacritics: https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-asciifolding-tokenfilter.html

Path Hierarchy: https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-pathhierarchy-tokenizer.html

Language: https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-lang-analyzer.html

NGram: https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-ngram-tokenizer.html

EdgeNgram: https://www.elastic.co/guide/en/elasticsearch/reference/7.6/analysis-edgengram-tokenizer.html

For advanced search queries on analyzed fields, the query can be adjusted to consider the analyzer. Bei erweiterten Suchabfragen nach analysierten Feldern kann die Abfrage so angepasst werden, dass der Analysator berücksichtigt wird.

Filter by label (Content by label)

showLabels	false
max	50
cql	label = "advanced-search" and label = "analyzer" and space = "SOL"

Versions Compared

Old Version 3

New Version 4

Key

Simple Search Analyzer

Simple Search Analyzer

No Diacritics Analyzer

Path Hierarchy Analyzer

Language Analyzer

Ngram Analyzer

Edge NGram Analyzer

Nützliche Links in der ElasticSearch

-Dokumentation