Comments (3)
Le test que j’avais fait partait d’une configuration d’ordre lexicographique similaire (aplati). Et en effet, il faudra voir si ça vaut le coup de faire quelque chose de plus factorisé, peut-être quand je verrai d’autres dictionnaires plus compliqués de ce point de vue… Après, un ordre aplati n’est pas foncièrement mauvais, d’autant plus qu’il peut être généré par un microscript si le nombre d’éléments répétés est très grand…
from na.
Je travaille dessus en ce moment, mais ça peut vite devenir difficile à tester… Pourrais-tu me donner une liste plus longue d’éléments à trier, et le résultat désiré ? Idéalement, avec des tons simples, composés, avec et sans suffixes, un nombre de syllabes variables, et avec et sans numéro d’homonyme…
J’ai fait un premier test avec des entrées fictives : on voit l’expression et les indices de tri :
"bv̩˥" => [Any[(5, 58), (0, 1)], Any[(0, 0, 1)], Any[(0, 0)]]
"bv̩˧" => [Any[(5, 58), (0, 1)], Any[(0, 0, 4)], Any[(0, 0)]]
"bv̩˩" => [Any[(5, 58), (0, 1)], Any[(0, 0, 7)], Any[(0, 0)]]
"bv̩˩˧" => [Any[(5, 58), (0, 1)], Any[(0, 0, 7, 4)], Any[(0, 0)]]
"ʝ˥i1" => [Any[(22, 19)], Any[(0, 1, 0)], Any[(0, 0, 2)]]
"ʝ˥i2" => [Any[(22, 19)], Any[(0, 1, 0)], Any[(0, 0, 3)]]
"ʝ˥αi1" => [Any[(22, 19)], Any[(0, 2, 0)], Any[(0, 0, 2)]]
"ʝ˥αi2" => [Any[(22, 19)], Any[(0, 2, 0)], Any[(0, 0, 3)]]
"ʝ˥βi1" => [Any[(22, 19)], Any[(0, 3, 0)], Any[(0, 0, 2)]]
"ʝ˥βi2" => [Any[(22, 19)], Any[(0, 3, 0)], Any[(0, 0, 3)]]
"ʝ˧i" => [Any[(22, 19)], Any[(0, 4, 0)], Any[(0, 0)]]
"ʝ˧αi" => [Any[(22, 19)], Any[(0, 5, 0)], Any[(0, 0)]]
"ʝ˧βi" => [Any[(22, 19)], Any[(0, 6, 0)], Any[(0, 0)]]
"ʝ˩i" => [Any[(22, 19)], Any[(0, 7, 0)], Any[(0, 0)]]
"ʝ˩αi" => [Any[(22, 19)], Any[(0, 8, 0)], Any[(0, 0)]]
"ʝ˩βi" => [Any[(22, 19)], Any[(0, 9, 0)], Any[(0, 0)]]
De manière un poil plus explicite :
1 → bv̩˥ : graphèmes : [(5, 58), (0, 1)] ; tons : [(0, 0, 1)] ; chiffres : [(0, 0)] – indices bruts : [[(5, 58), (0, 1)], [(0, 0, 1)], [(0, 0)]]
2 → bv̩˧ : graphèmes : [(5, 58), (0, 1)] ; tons : [(0, 0, 4)] ; chiffres : [(0, 0)] – indices bruts : [[(5, 58), (0, 1)], [(0, 0, 4)], [(0, 0)]]
3 → bv̩˩ : graphèmes : [(5, 58), (0, 1)] ; tons : [(0, 0, 7)] ; chiffres : [(0, 0)] – indices bruts : [[(5, 58), (0, 1)], [(0, 0, 7)], [(0, 0)]]
4 → bv̩˩˧ : graphèmes : [(5, 58), (0, 1)] ; tons : [(0, 0, 7, 4)] ; chiffres : [(0, 0)] – indices bruts : [[(5, 58), (0, 1)], [(0, 0, 7, 4)], [(0, 0)]]
5 → ʝ˥i1 : graphèmes : [(22, 19)] ; tons : [(0, 1, 0)] ; chiffres : [(0, 0, 2)] – indices bruts : [[(22, 19)], [(0, 1, 0)], [(0, 0, 2)]]
6 → ʝ˥i2 : graphèmes : [(22, 19)] ; tons : [(0, 1, 0)] ; chiffres : [(0, 0, 3)] – indices bruts : [[(22, 19)], [(0, 1, 0)], [(0, 0, 3)]]
7 → ʝ˥αi1 : graphèmes : [(22, 19)] ; tons : [(0, 2, 0)] ; chiffres : [(0, 0, 2)] – indices bruts : [[(22, 19)], [(0, 2, 0)], [(0, 0, 2)]]
8 → ʝ˥αi2 : graphèmes : [(22, 19)] ; tons : [(0, 2, 0)] ; chiffres : [(0, 0, 3)] – indices bruts : [[(22, 19)], [(0, 2, 0)], [(0, 0, 3)]]
9 → ʝ˥βi1 : graphèmes : [(22, 19)] ; tons : [(0, 3, 0)] ; chiffres : [(0, 0, 2)] – indices bruts : [[(22, 19)], [(0, 3, 0)], [(0, 0, 2)]]
10 → ʝ˥βi2 : graphèmes : [(22, 19)] ; tons : [(0, 3, 0)] ; chiffres : [(0, 0, 3)] – indices bruts : [[(22, 19)], [(0, 3, 0)], [(0, 0, 3)]]
11 → ʝ˧i : graphèmes : [(22, 19)] ; tons : [(0, 4, 0)] ; chiffres : [(0, 0)] – indices bruts : [[(22, 19)], [(0, 4, 0)], [(0, 0)]]
12 → ʝ˧αi : graphèmes : [(22, 19)] ; tons : [(0, 5, 0)] ; chiffres : [(0, 0)] – indices bruts : [[(22, 19)], [(0, 5, 0)], [(0, 0)]]
13 → ʝ˧βi : graphèmes : [(22, 19)] ; tons : [(0, 6, 0)] ; chiffres : [(0, 0)] – indices bruts : [[(22, 19)], [(0, 6, 0)], [(0, 0)]]
14 → ʝ˩i : graphèmes : [(22, 19)] ; tons : [(0, 7, 0)] ; chiffres : [(0, 0)] – indices bruts : [[(22, 19)], [(0, 7, 0)], [(0, 0)]]
15 → ʝ˩αi : graphèmes : [(22, 19)] ; tons : [(0, 8, 0)] ; chiffres : [(0, 0)] – indices bruts : [[(22, 19)], [(0, 8, 0)], [(0, 0)]]
16 → ʝ˩βi : graphèmes : [(22, 19)] ; tons : [(0, 9, 0)] ; chiffres : [(0, 0)] – indices bruts : [[(22, 19)], [(0, 9, 0)], [(0, 0)]]
from na.
Désolé d'avoir traîné à répondre.
J'ai essayé un truc pas beau à voir : faire une liste "en dur" des combinaisons entre tons et indices. (Pour les numéros d'homonymes, il semble qu'il n'y ait pas de souci : que Lexika gère ça sans besoin d'un aménagement spécifique.)
J'ai remplacé l'ordre suivant :
tons: [˥, ˧, ˩, α, β, γ, $, "#"]
par
tons: [˥, ˥α, ˥β, ˥γ, ˧, ˧α, ˧β, ˧γ, ˩, ˩α, ˩β, ˩γ, ˩˧, ˩˧α, ˩˧β, ˩˧γ, ˩˥, ˩˥α, ˩˥β, ˩˥γ, ˧˥, ˧˥α, ˧˥β, ˧˥γ, $, "#"]
Ca donne le résultat souhaité, ce qui est déjà beaucoup !
Du coup je me permets de fermer le ticket. Si tu (@BenjaminGalliot) souhaites faire quelque chose de plus beau et plus économique au plan informatique pour l'ordre ci-dessus, aucune contre-indication ; après, ça ne serait pas forcément économique en termes de ton temps (pour ça, à toi de gérer, dans un contexte où le traitement des petits soucis restants et la mise à flots de la version française et de la version anglaise auraient, à mes yeux, la priorité).
from na.
Related Issues (20)
- Déplacement du champ \rf vers la fin d'un bloc 'exemple' HOT 1
- Traitement des mots dont la vedette commence par un tiret HOT 4
- [dictionnaire] tri séparé des rimes ɻ̍ et ɻ̍̃ HOT 3
- [dictionnaire] protéger les tirets bas : ne pas les interpréter en LaTeX comme mise en indice HOT 7
- [dictionnaire] traitement des balises |fn à l'intérieur des divers champs HOT 1
- prise en compte de l'étiquette print = "n" HOT 1
- encodage des références : champ \rf HOT 1
- encodage des références : champs \rf, \txt, \doi HOT 1
- affichage dans le PDF des entrées lexicales des clitiques, dont la vedette commence par un signe égal = HOT 4
- mise en indice des lettres grecques : généraliser aux divers champs. HOT 5
- typographie des gloses : petites capitales HOT 26
- vérification complétude & cohérence fichier na.lex : quelques heuristiques / tests ? HOT 2
- dictionnaire : affichage des entrées commençant par † HOT 1
- dictionnaire : gestion des commentaires et notes (et des champs pas encore pris en compte) HOT 13
- encodage pour langues autres que na, chinois, français, anglais HOT 1
- Afficher l'étymologie (en na) de mots d'emprunt HOT 3
- Classement des entrées : une curiosité pour la lettre H HOT 3
- Commentaires et notes : ticket mis à jour HOT 1
- un détail de typographie : espacement après identification source exemple (\rf)
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from na.