Coder Social home page Coder Social logo

Comments (6)

alxndr-w avatar alxndr-w commented on May 28, 2024

Hätte ich mal #RTFM gemacht.
https://github.com/tyrant88/search_it/blob/master/plugins/documentation/docs/de_de/howto-simsearch.md

Das ist noch aus der RexSearch-Doku:

Search it baut anschließend bei jeder Suche, die einen Treffer ergab, einen Schlagwortindex aus. Dabei wird angenommen, dass Wörter, die zu Suchergebnissen führen, richtig geschrieben sind.

Tipp: Um die Ähnlichkeitssuche effektiv einsetzen zu können, empfiehlt es sich, die Suche selbst mit richtigen Schlagwörtern zu füttern. Dadurch sind erste Suchwörter indexiert und die Ähnlichkeitssuche kann bei einer falschen Schreibweise dieser Wörter diese vorschlagen.

Ist natürlich utopisch, bei größeren Seiten erstmal selbst 1000 Begriffe fehlerfrei einzugeben und zu erwarten, dass nur fehlerfreie Begriffe in den Index kommen - wobei der selbstlernende Ansatz ja gar nicht so schlecht ist.

Um bei dem Beispiel oben zu bleiben: Wenn Puddi als Teilwort Pudding findet, sollte stattdessen Pudding in den Ähnlichkeits-Index aufgenommen werden.

Ich werde mal testen, ob der Effekt auch bei MATCH AGAINST eintritt - vielleicht war die Ähnlichkeitssuche nie dafür gedacht, mit dem LIKE-Modus zu arbeiten.

from search_it.

alxndr-w avatar alxndr-w commented on May 28, 2024

Idee: Eingabe Optional mit hunspell vorbehandeln. (Man wird ja wohl noch träumen dürfen)

from search_it.

tyrant88 avatar tyrant88 commented on May 28, 2024

können wir das mal schließen?

from search_it.

alxndr-w avatar alxndr-w commented on May 28, 2024

Das Problem besteht weiterhin, dass Teilwörter in den Index aufgenommen werden und dadurch die Ähnlichkeitssuche mit falschen Wörtern befüllt wird und man Ähnlichkeitssuche + LIKE-Modus nicht gemeinsam verwenden kann.

from search_it.

tyrant88 avatar tyrant88 commented on May 28, 2024

Problem besteht, aber stört keinen? ;;;;-)

from search_it.

alxndr-w avatar alxndr-w commented on May 28, 2024

Ich kann mir auch heute gut vorstellen, bei der Indexierung einen Keyword-Index mit aufzubauen. Das Problem da oben ist der Grund, dass ich die Ähnlichkeitssuche nicht aktiviere. Denn so ist sie Murks.

from search_it.

Related Issues (20)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.