Coder Social home page Coder Social logo

nicolamunozi / fc_sv_txt Goto Github PK

View Code? Open in Web Editor NEW
0.0 1.0 0.0 40 KB

Español: cree un conjunto de datos de tarjetas flash a partir de un archivo .txt. Palabra, significado, etimología, ejemplos, clase. English: create Flash Cards dataset from a .txt file. Word, meaning, etymology, examples, class.

License: MIT License

Python 100.00%
csv-data data-structures dataset flashcards json-data language-resources webscraping python

fc_sv_txt's Introduction

Creación automatizada de datos para Tarjetas Mnemotecnicas (Flash Cards) de vocabulario en Español usando Python.

Utilice una API de RAE para crear datasets de Tarjetas nmemotecnicas de vocabulario en español. Esta automatización toma un .txt como archivo de entrada. Y devuelve archivos .json y .csv.
Los datos incluyen dos categorías:

  • question: Palabra en Español
  • answer: Etimología de la palabra, clase, definición y ejemplos.

La definición y la clase están garantizadas para cada palabra del diccionario de la RAE.

Instalación

  1. Clonar a su dispositivo local.
  2. Navegue a la carpeta principal del proyecto en la terminal.
  3. Crear un entorno virtual usando requirements.txt
# Usando pip
pip install -r requirements.txt

# Usando conda
conda create --name <nombre_entorno_virtual> --file requirements.txt

Cómo utilizar

Los códigos se encuentran dentro de ./code/ y algunas variables dentro se refieren a archivos ubicados en ./Vocabulario/ESP/.

Evite cambiar el nombre de los archivos.

Para crear sus propios datos de Flash Cards en español:

  1. Navega a la carpeta ./Vocabulario/ESP/ y edita vocabulario_esp.txt con tu propia palabra. Asegúrese de insertar 1 palabra por línea:

     palabra1,
     palabra2,
     palabra3,
     palabra4,
    

    Está bien incluir el carácter , al final de cada palabra. Evite usar cualquier otro signo de puntuación, es decir, (., :, ;, etc). La codificación UTF-8 es utilizada para hacerse cargo de la acentuación común en palabras en español.

  2. Ejecute main.py para obtener el archivo flash_cards_esp.json almacenado en Vocabulario/Esp/. Para hacer esto, navegue a la página principal carpeta del proyecto en la terminal y escriba:

    conda activate <nombre_entorno_virtual>
    cd code
    python main.py
    

    Verá el flujo de trabajo del código en la terminal... algo como esto:

     2022-09-14 11:08:37,339 - INFO - dle.search_by_url - Realizando solicitud a: 'https://dle.rae.es/connivencia'...
     2022-09-14 11:08:38,002 - INFO - dle.search_by_url - Realizando solicitud a: 'https://dle.rae.es/aunar'...
     2022-09-14 11:08:38,746 - INFO - dle.search_by_url - Realizando solicitud a: 'https://dle.rae.es/vivisecciones'...
    
  3. En este punto, puede ejecutar create_csv.py, que usa los datos json creados antes para crear el archivo flash_cards_esp.csv en la carpeta Vocabulary/Esp/.

     python crear_csv.py
    
  4. Puede usar los datos creados para importar varias tarjetas flash en aplicaciones.

    Algunas opciones:

     Si es usuario de IOS, puedes instalar esta aplicación gratuita que permite importar tarjetas desde datos con formato json: copie el texto dentro de flash_cards_esp.json y péguelo en el cuadro de importación.

     En aplicaciones en línea como esta puedes usar los datos con formato csv. Abra flash_cards_esp.csv en modo de edición  (debería verse como esto). Copie el texto y péguelo en la sección COPIAR Y PEGAR SUS DATOS. Luego, seleccione la opción COMA para ENTRE TÉRMINO Y DEFINICIÓN y PERSONALIZADO en ENTRE DEFINICIÓN Y TARJETA y llene el cuadro con ."\n.  Finalmente, cree tarjetas flash. IMPORTANTE: Asegúrese de que  asegúrese de que el lado de la sugerencia esté oculto.

     En esta otra opción puede importar tarjetas flash directamente cargando el archivo CSV.

Autores

Retroalimentación

Si tiene algún comentario, comuníquese conmigo a [email protected]

fc_sv_txt's People

Contributors

nicolamunozi avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.