Coder Social home page Coder Social logo

voluntexi.github.io's Introduction

Hi there 👋

😄 welcome

voluntexi.github.io's People

Contributors

voluntexi avatar

Stargazers

 avatar

Watchers

 avatar

voluntexi.github.io's Issues

Prompt Learning | 威伦特

https://voluntexi.github.io/prompt-learning/

Prompt Learning 的本质就是将所有下游任务统一成预训练任务; 以特定的模板,将下游任务的数据转成自然语言形式,从而充分挖掘预训练语言模型本身的能力。

概述
将所有下游任务统一成预训练任务;以特定的模板,将下游任务的数据转成自...

FastText | 威伦特

https://voluntexi.github.io/fasttext/

FastText是在word2vec的cbow和skip-gram基础上得到模型,其最大的特点是模型简洁,训练速度快且文本分类准确率也令人满意

fastText 训练词向量的时候一般是使用Skip-gram模型的变种。在用作文本分类的时候...

中文分词方法总结 | 威伦特

https://voluntexi.github.io/zi-fu-chuan-pi-pei/

本文介绍的是基于字符串匹配的中文分词的方法。

通过按照一定策略将待分析的汉字串与一个“词典”中的词条进行匹配,若在词典中找到某个字符串,则匹配成功。
字符串匹配算法:
在通过确定了词典后,目标句子可能含有很多词典中的词语。它们可能互相重叠...

RNN | 威伦特

https://voluntexi.github.io/rnn/

递归神经网络(Recurrent Neural Network, RNN)是一种专门处理序列的神经网络。它们通常用于自然语言处理(NLP) 任务,因为RNN在处理文本方面非常有效。

第一句话:我喜欢吃苹果!
第二句话:苹果真是一家很棒的...

GloVe | 威伦特

https://voluntexi.github.io/glove/

GloVe(Global Vectors)是常见的词向量表示方法,GloVe模型认为语料库中单词出现的统计是学习词向量表示的无监督学习算法的重要因素。相较于word2vec,GloVe利用语料库的全局信息。

论文地址:GloVe: Glo...

CNN | 威伦特

https://voluntexi.github.io/cnn/

卷积神经网络(Convolutional Neural Networks, CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks),是深度学习(deep learning)的代表算法...

MoCa | 威伦特

https://voluntexi.github.io/moca/

BRIO在生成式文本摘要领域SOTA位置还没坐稳几个月,便出现了新的SOTA—MoCa

概述
在上一篇文章中说明了BRIO这个在文本摘要抽取领域的训练新范式,BRIO通过利用对比学习(contrastive learning)来构建一个评...

第三届“传智杯”全国大学生IT技能大赛(初赛B组)个人题解 | 威伦特

https://voluntexi.github.io/di-san-jie-chuan-zhi-bei-quan-guo-da-xue-sheng-it-ji-neng-da-sai-chu-sai-b-zu-ge-ren-ti-jie/

题也不算难,因为第一次打比赛,所以也有失误 。

总结
这次算是第一次在洛谷OJ打比赛,之前一直在LeetCode刷题,这两个平台提交代码类型不一样,
导致我没有适应过来洛谷的比赛环境,所以一直在疯狂出错,而比赛提交错误又有罚时,所以......

Word2Vec | 威伦特

https://voluntexi.github.io/word2vec/

Word2Vec
Word2Vec是常用的词嵌入模型之一。Word2Vec实际是一种浅层的神经网络模型,它有两种网络结构,分别是CBOW(Continues Bag of Words)连续词袋和Skip-gram。 我们可以选择其中一个方法...

LoRA | 威伦特

https://voluntexi.github.io/lora/

在如今大模型时代,如果需要微调一个大模型无疑在时间和金钱方面的消耗是巨大的,而LoRA通过冻结了预训练的模型权重,并将可训练的秩分解矩阵注入到Transformer架构的每一层中,大大减少了下游任务的可训练参数的数量。尽管LoRA使得可训练...

SimCSE | 威伦特

https://voluntexi.github.io/SimCSE/

最近做实验需要用到Sentence Embeddings(句向量),特地研究了一下句向量相关模型算法,其中 SimCSE 模型是目前比较火、效果也比较好的一个模型。

介绍
SimCSE(Simple Contrastive Learni...

神经网络 | 威伦特

https://voluntexi.github.io/shen-jing-wang-luo/

最近学习神经网络的时候,发现大多介绍神经网络的文章都是先大篇幅的描述概念,然后莫名其妙就丢出很多晦涩难懂的数学公式,就结束了,让人看得一头雾水。
直到最近看了一篇文章,它通过实例和概念相结合的方式介绍神经网络,对初学者十分友好,于是我将其与...

依存语法分析 | 威伦特

https://voluntexi.github.io/yi-cun-yu-fa-fen-xi/

语法分析(syntactic parsing )其目标是分析句子的语法结构并将其表示为容易理解的结构(通常是树形结构)。

短语结构树
语言具备有自顶而下的层级关系,固定数量的语法结构能够生成无数句子。
比如,通过下列两个语法规律,我们就能...

Longformer | 威伦特

https://voluntexi.github.io/longformer/

Longformer是一种用来拓展模型在长序列建模的能力算法,它提出了一种时空复杂度同文本序列长度呈线性关系的Self-Attention,用以保证能够使得模型高效处理长文本。

Tranformer由于采用的是“全连接”型的注意力机制,在...

BRIO | 威伦特

https://voluntexi.github.io/brio/

BRIO是2022年文本摘要领域SOTA,通过结合了对比学习解决了生成式摘要领域seq2seq自回归中的exposure bias问题

概述
在文本摘要抽取领域,通常利用深度模型监督学习的方式进行文本摘要,这类方法基本都是将摘要抽取看着是...

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.