Coder Social home page Coder Social logo

mhbashari / awesome-persian-nlp-ir Goto Github PK

View Code? Open in Web Editor NEW
699.0 46.0 113.0 197 KB

Curated List of Persian Natural Language Processing and Information Retrieval Tools and Resources

persian-language natural-language-processing information-retrieval language-detection persian-nlp corpus part-of-speech-tagger normalizer named-entity-recognition embeddings

awesome-persian-nlp-ir's Introduction

awesome-persian-nlp-ir's People

Contributors

alirezatheh avatar amirmojiry avatar amnghd avatar ashalogic avatar datquocnguyen avatar de-mh avatar eteamin avatar hameds avatar hamidhabibzadeh avatar hkhojasteh avatar htaghizadeh avatar jonsafari avatar joyebright avatar m3hrdadfi avatar mehrad0711 avatar mhbashari avatar mohamad-dehghani avatar mohammadheydari avatar mohsenmahmoodzadeh avatar narimann2 avatar nshmyrev avatar pourmand1376 avatar realamirhe avatar rominaoji avatar sajjjadayobi avatar sir-kokabi avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

awesome-persian-nlp-ir's Issues

پیشنهاد برای اضافه کردن این لیست به یک لیست محبوب

سلام.
یه مخزنی هست به اسم Awesome که در واقع لیست‌هایی مثل این لیست شما رو معرفی می‌کنه. منتهی برای اینکه بتونید لیست خودتون رو در این مخزن قرار بدید که باعث می‌شه بیشتر دیده بشید باید شیوه‌نامهٔ سفت‌وسختی رو رعایت کنید. مثلاً در بخشی از این شیوه‌نامه اومده که باید تمام مشکلات گزارش شده توسط ابزار Awesome lint برطرف بشه. من یک فورک گرفتم و بخشی از این مشکلات رو حل کردم. ولی چون حل برخی از مشکلات نیازمند تغییرات گسترده و زمان‌بر در لیست‌ها هست گفتم با شما مشورت کنم که اگر مایل به انجام این کار هستید ادامه بدم. مثلاً یکی از شروط اینه که نباید یک ابزار در چند زیردسته معرفی بشه. خب برای حل این مشکل باید تغییراتی در دسته‌بندی‌ها بدیم. همچنین به جز سه فایلی که در ریشهٔ ریپو می‌بینید نباید فایل دیگه‌ای وجود داشته باشه. شاخه پیش‌فرض باید main باشه نه master. لایسنس رو باید از طریق گیتهاب اضافه کنید. باید حتماً یک تاپیک awesome در مخزن وجود داشته باشه و یک‌سری ریزه‌کاری‌های دیگه.

Persian NER

پیکره متنی NER فارسی مبتنی بر داده‌های ویکی پدیا فارسی به صورت اپن سورس منتشر شده که شامل حدود ۲۵ میلیون توکن در قالب حدود یک میلیون جمله است. لطفاً آن را به لیست مخزن awesome persian nlp اضافه کنید

مخزن گیت‌هاب پیکره

همچنین امکان مشارکت در بهبود این پیکره (که مشارکت‌ها نیز به صورت اپن سورس منتشر می‌شوند) نیز از طریق https://app.text-mining.ir فراهم است

opensource-persian-ner

Datasets

سلام.
در قسمت دیتاست‌ها، اگر بخوام اطلاعاتی درمورد نحوه ساخت CPG: Corpus of Persian Grammatical Errors یا اطلاعات دیگه‌ای درموردش پیدا کنم باید کجا مراجعه کنم؟

مثالی از ورد تو وک تک

سلام
قطعه کد پایین یک جمله رو میگیره ورد تو وک تک تک تک کلمات رو برمیگردنه. برای انگلیسی کار میکنه ولی برای فارسی کار نمیکنه .میشه لطف کنید از این کتابخونتون یک مثال مثل این کد بیارید که بشه ورد تو وک تک کلمات جلمه رو برگردونه

from gensim.models import Word2Vec as wv
for sentence in sentences:
    tokens = sentence.strip().lower().split(" ")
    tokenized.append(tokens)
model = wv(tokenized
    ,size=5,
          min_count=1)
print('done2')
model.save('F:/text8/text8-phrases1')
print('done3')
print(model)
model = wv.load('F:/text8/text8-phrases1')

print(model.wv.vocab)

با تشکر

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.