1.前端提供搜索接口 , 接受用户传递的参数
2.从sphinx建立好的索引文件中 , 查询相关参数的oid , 再拿这些oid从mysql中直接读取 , 在前端显示
3.分页
4.登录验证
使用者可以在关键词的list中添加指定的关键词,比如我专业查询领域是明星,歌手,我把这个两个关键词添加到key_word中
#备选词库,关键词相关,可手动添加
key_word = ["明星","歌手"]
之后直接在目录下python get_dict.py即可从搜狗官网更新所有相关的词库到原生的词库中
同时,其会生成两个文件夹:
/index_update/sougou/ 保存了所有下载到本地的词典,格式为.scel,每次更新都是直接覆盖原先的文件
/usr/local/mmseg3/bak/ 保存上一次的词典相关文件:unigram.txt / uni.lib
本项目网址为:
tingyun版权搜索
由于暂时是测试版,只显示前20条关联性最大的数据,之后会再继续优化新的内容展示以及对新内容的抓取
有什么意见和建议,欢迎随时向博主留言.