aka-zyq Goto Github PK
Type: User
Type: User
确定需要的变量,并使用相关数据库。建立字典、列表(names、relationship、line_names)储存名字,关系。在此之前需要建立一个关于《黎明破晓的街道》的主要角色名称TXT文档,我将之命名为Introduction to key people.txt 。文本中实体识别。读入《黎明破晓的街道》剧本的每一行,对其做分词,判断该词的词性是不是“人名”(nr作用:判断是否是人名),提取每段人物,存入line_names。根据识别结果构建网络。对于 lineNames 中每一行,我们为该行中出现的所有人物两两相连。如果两个人物之间尚未有边建立,则将新建的边权值设为 1,否则将已存在的边的权值加 1。这种方法将产生很多的冗余边,这些冗余边将在最后处理。过滤冗余边。将已经建好的 names 和 relationships 输出到文本,以方便 gephi 可视化处理。输出边的过程中可以过滤可能是冗余的边,这里假设共同出现次数少于 10 次的是冗余边,则在输出时跳过这样的边。输出结果。由于gephi导入电子表格,故生成文件扩展名为csv。输出的节点集合保存为 黎明破晓的街道_node.csv ,边集合保存为 黎明破晓的街道_edge.csv。运行。会在相应文件夹python综合项目中生成黎明破晓的街道_node.csv、黎明破晓的街道_edge.csv 。使用gephi生成可视化网络。
2020 科大讯飞 事件抽取挑战赛
AbstractKnowledgeGraph, a systematic knowledge graph that concentrate on abstract thing including abstract entity and action. 抽象知识图谱,目前规模50万,支持名词性实体、状态性描述、事件性动作进行抽象。目标于抽象知识,包括抽象实体,抽象动作,抽象事件。基于该知识图谱,可以进行不同层级的实体抽象和动作抽象,这与人类真实高度概括的认知是一致的。
A flask API that generates a description for any image using AI.
PyTorch Implementation of paper "Attention-Based Bidirectional Long Short-Term Memory Networks for Relation Classification"
论文介绍:针对已有模型不能充分提取语义特征,以及单一使用语义或语言学特征来进行预测等不足,使用BERT预训练模型进行句子层面的特征提取。同时阅读了关于多模态以及特征融合的论文,使用LSTM-Attention和CNN进行文档层面特征提取,同时结合Mairesse语言学特征,将多个层面提取的特征融合起来进行分析,最终使用Pytorch进行模型实现。
新闻文本自动摘要, 以Textrank 为基础,融入 标题特征,单句位置特征,重要实体特征,线索词特征,做句子的综合权重计算,并使用MMR算法,兼顾自动摘要的主题相关性和摘要多样性。
A curated list of Knowledge Graph related learning materials, databases, tools and other resources
本项目是NLP领域一些任务的基准模型实现,包括文本分类、命名实体识别、实体关系抽取、NL2SQL、CKBQA以及BERT的各种下游任务应用。
Tensorflow solution of NER task Using BiLSTM-CRF model with Google BERT Fine-tuning And private Server services
bert中文分类实践
使用Bert,ERNIE,进行中文文本分类
使用Bert完成实体之间关系抽取
PyTorch implementation for "Matching the Blanks: Distributional Similarity for Relation Learning" paper
一行代码使用BERT生成句向量,BERT做文本分类、文本相似度计算
利用bert预训练的中文模型进行文本分类 数据集中文情感分析语料chnsenticorp
文本二分类任务,是否文档是否属于政治上的出访类事件,利用BERT提取特征,模型采用简单的DNN。
使用BERT模型进行文本分类,相似句子判断,以及词性标注
毕业设计:基于Bert_Position_BiLSTM_Attention_CRF_LSTMDecoder的法律文书要素识别
pytorch实现 Bert 做seq2seq任务,使用unilm方案,现在也可以做自动摘要,文本分类,情感分析,NER,词性标注等任务,支持t5模型,支持GPT2进行文章续写。
基于BERT-BLSTM-CRF 序列标注模型,支持中文分词、词性标注、命名实体识别、语义角色标注。
ChineseNER based on BERT, with BiLSTM+CRF layer
Computing similarity of two sentences with google's BERT algorithm。利用Bert计算句子相似度。语义相似度计算。文本相似度计算。
BERT+Self-attention Encoder ; Biaffine Decoder ; Pytorch Implement
BiLstm+CNN+CRF 法律文档(合同类案件)领域分词(100篇标注样本)
基于BIO模式的序列标注工具-可用于命名实体识别、事件触发词识别等任务的数据标注
A simple bionic text converter that can take a file (pdf, txt, docx), extract the text, and convert it into bionic text.
Source code for ACL 2021 finding paper: CasEE: A Joint Learning Framework with Cascade Decoding for Overlapping Event Extraction
CausalKnowledgeBase, causal knowledge base including causal pairs extracted from web text using the methods like PMI, Collocation。基于网络文本的因果知识库项目,采用PMI,搭配抽取等方法,形成因果对频繁集。
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.