Comments (6)
Hätte ich mal #RTFM gemacht.
https://github.com/tyrant88/search_it/blob/master/plugins/documentation/docs/de_de/howto-simsearch.md
Das ist noch aus der RexSearch-Doku:
Search it baut anschließend bei jeder Suche, die einen Treffer ergab, einen Schlagwortindex aus. Dabei wird angenommen, dass Wörter, die zu Suchergebnissen führen, richtig geschrieben sind.
Tipp: Um die Ähnlichkeitssuche effektiv einsetzen zu können, empfiehlt es sich, die Suche selbst mit richtigen Schlagwörtern zu füttern. Dadurch sind erste Suchwörter indexiert und die Ähnlichkeitssuche kann bei einer falschen Schreibweise dieser Wörter diese vorschlagen.
Ist natürlich utopisch, bei größeren Seiten erstmal selbst 1000 Begriffe fehlerfrei einzugeben und zu erwarten, dass nur fehlerfreie Begriffe in den Index kommen - wobei der selbstlernende Ansatz ja gar nicht so schlecht ist.
Um bei dem Beispiel oben zu bleiben: Wenn Puddi
als Teilwort Pudding
findet, sollte stattdessen Pudding in den Ähnlichkeits-Index aufgenommen werden.
Ich werde mal testen, ob der Effekt auch bei MATCH AGAINST eintritt - vielleicht war die Ähnlichkeitssuche nie dafür gedacht, mit dem LIKE-Modus zu arbeiten.
from search_it.
Idee: Eingabe Optional mit hunspell vorbehandeln. (Man wird ja wohl noch träumen dürfen)
from search_it.
können wir das mal schließen?
from search_it.
Das Problem besteht weiterhin, dass Teilwörter in den Index aufgenommen werden und dadurch die Ähnlichkeitssuche mit falschen Wörtern befüllt wird und man Ähnlichkeitssuche + LIKE-Modus nicht gemeinsam verwenden kann.
from search_it.
Problem besteht, aber stört keinen? ;;;;-)
from search_it.
Ich kann mir auch heute gut vorstellen, bei der Indexierung einen Keyword-Index mit aufzubauen. Das Problem da oben ist der Grund, dass ich die Ähnlichkeitssuche nicht aktiviere. Denn so ist sie Murks.
from search_it.
Related Issues (20)
- Die Ähnlichkeitssuche erzeugt teilweise extrem lange SQL-Anfragen HOT 18
- Updatefehler von 6.7.3 auf 6.8.8 (redaxo 5.13.0-beta2) HOT 6
- Offlinesprachen werden indexiert HOT 7
- Serialization failure: 1213 Deadlock found when trying to get lock
- documentation-plugin: fehlermeldung wenn backendsprache nicht deutsch HOT 1
- Setup -> Umstellung auf utf8mb4 -> Fehler bei der Datenbankaktualisierung HOT 4
- Warning: Undefined array key "clang_id" beim Indexieren HOT 2
- CHANGELOG.md - headline structure is malformed
- Zusätzliche Datenquellen - Ausschluss/ Manipulation von diversen Zeilen HOT 2
- Re-Indexieren von yForm 4 Tabellen HOT 12
- utf8_encode() ist in php 8.2 deprecated HOT 2
- SQLSTATE[HY000]: General error HOT 3
- Aktiviertes Maintenance-Modul HOT 6
- "Maximale Trefferanzahl" -1 führt zu sql error HOT 1
- Plugins entfernen HOT 1
- Problem: PHP Type Hints Mixed
- Warning beim indexieren HOT 7
- Warnung zu unspezifisch - X Spalten indexiert HOT 3
- Speichern eines YForm Datensatzes, indexiert alle Datensätze HOT 7
- Artikel die in Offline-Kategorien sind, werden indexiert. HOT 2
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from search_it.