Coder Social home page Coder Social logo

studyzy / imewlconverter Goto Github PK

View Code? Open in Web Editor NEW
7.2K 136.0 615.0 57.5 MB

”深蓝词库转换“ 一款开源免费的输入法词库转换程序

License: GNU General Public License v3.0

C# 99.82% Dockerfile 0.15% Makefile 0.02%
ime c-sharp converter chinese-characters dotnet dotnet-core

imewlconverter's Introduction

深蓝词库转换

Stars Actions Check License Repo size Code Count

Join the chat Release Downloads

一款输入法词库转换软件,支持以下超过 20 种的输入法工具和词库

本程序支持批量转换(一次拖拽多个词库文件,或者按住 Ctrl 选择多个文件),支持命令行模式(在命令行下使用-h命令查看帮助),支持 Windows、Linux、MacOS。

支持列表

PC 端:

手机端:

  • QQ 手机拼音
  • 百度手机拼音(文本词库和 bcd 格式)
  • 谷歌拼音输入法

该软件支持 6 种以上的输入法编码方法:

  • 仓颉
  • 二笔(超强二笔,青松二笔等)
  • 拼音(全拼、双拼)
  • 五笔(五笔 86、五笔 98、新世纪五笔)
  • 郑码
  • 注音
  • 自定义

License

FOSSA Status

Star History

Star History Chart

imewlconverter's People

Contributors

52fisher avatar anluoridge avatar anthonyzjiang avatar cabbage89 avatar cgcel avatar eallion avatar fossabot avatar gitter-badger avatar liuxilu avatar mritd avatar nopdan avatar studyzy avatar tumuyan avatar yfdyh000 avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

imewlconverter's Issues

命令行下的bug

private WordLibraryList Filter(WordLibraryList list) { var result = new WordLibraryList(); foreach (WordLibrary wordLibrary in list) { if (IsKeep(wordLibrary)) { //这个地方需要检测空,命令行下面报错 if (ReplaceFilters != null) foreach (IReplaceFilter replaceFilter in ReplaceFilters) { replaceFilter.Replace(wordLibrary); } if (wordLibrary.Word != string.Empty) result.Add(wordLibrary); } } return result; }

ime wl converter\ime wl converter\mainbody.cs

果然win10微软拼音自定义短语对双拼还是不友好

default
虽然一开始得知这个消息就觉得很不祥
自定义短语啥时候这么好用啦?
用的时候才发现根本没有平常用的词
看了一下短语
好嘛 这是只有在用全拼时才会触发的啊……
只能说等哪天各位大佬解析出了dat的结构了

“无拼音纯汉字”大文件转“chinese-pyim”提示“不好意思,发生了错误:未将对象引用设置到对象的实例。”

“无拼音纯汉字”大文件转“chinese-pyim”提示“不好意思,发生了错误:未将对象引用设置到对象的实例”。

文件约有10万条词库,转换到最后出来这个提示。设置中只更改了高级设置中的词频设置为“Google搜索”,其他设置未做修改。 @tumashu

我试过比较小的文件按照同样的设置不会有问题。

image

下面是我的词库文件。

pseudo-original-hundred-thousand.txt

win7下,其他词库转Rime-注音(terra_pinyin)词库,会报错,无法正常使用

我下了源代码,调试后发现是代码中,这两个地方要改:
//DictionaryHelper的Dict的构造方法中:分隔符"\r\n"要改为"\n",不然接下来所有解析代码全错。

//PinyinHelper的PinYinWithToneDict中,py.Split(';')的分隔符要改为',',不然解析的拼音全错。

win7下测试通过,修掉后,Rime的地球拼音就能无障碍正常使用了。

百度手机的词频不对啊

版本是最新的代码自己编译的,
百度手机的词库转成谷歌的一看,词频全是1,
百度手机词库里的词频是(60000+真正的词频)或者(55000+真正的词频),
导出来全是1,

BUG求助QAQ

百度手机导出无反应。就是0字节。

内存溢出

2.2版本--细胞词库转微软拼音词库时,微软拼音词库占地太大,极易内存溢出,能否增加内存占用设置,或使用类似winrar的临时文件?

增加可运行的文件

你好,建议把打包后的可执行文件加入到项目中,这样使用的人不作自己编译也可以用了

Win10微软拼音不支持双拼

导出来的全是全拼,双拼用户完全没法用...

再喷一下微软拼音:
我把10000多条词库导入到自定义短语直接导致微软拼音设置窗口卡死了,说明使用自定义短语来导入词库这个做法本身就有点不合适,
真正适合的导入方式应该是微软的专业词库功能,然而微软又没有提供相应接口...

转化后的词频全为1

版本:2.2.1.0
转化词库(.scel)为txt文件,选择自定义方式,输出txt文件格式正确,但所有词的词频全都是1,请问下是什么原因?有办法解决吗?谢谢了!

关于算法溢出

你好。我在使用Win10系统。下载的是2.2版本的转化器。从搜狗的bin文件转换到微软win10拼音输入法的词库时,出现了算术运算导致溢出的错误。请问应该如何解决?

大神,能不能加个txt转五笔scel细胞词库

大神,能不能加个txt转五笔scel细胞词库,
最近用搜狗五笔,自己做了几十万的五笔词库txt文件,但在网上只能scel转txt的,官方上传转换只能是50000个一个文件,所以想大神能不能加个直接转scel的功能。

win10输入法的dat词库无法导入

现在win10输入法导出的词库是dat文件,而源选择win10输入法,目标位Linux rime,但是导出结果为0条?请问是不是dat格式的问题,如果是咱该如何操作谢谢

词库默认文件名为ChsPinyinUDL.dat

优化建议

window下换行"\r\n",linux下换行"\n"。
在将词典转换成txt文本的时候,可以添加指定换行符的功能

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.