Coder Social home page Coder Social logo

streaming_platforms's Introduction

header

INDICE:

Tabla de contenido
  1. TÍTULO E IMAGEN DE PORTADA
  2. ÍNDICE
  3. INTRODUCCIÓN
  4. OBJETIVO
  5. DESCRIPCIÓN
  6. ESTADO
  7. DEMOSTRACIÓN
  8. ACCESO AL PROYECTO
  9. TECNOLOGÍAS UTILIZADAS
  10. DESARROLLADORES DEL PROYECTO
  11. CONCLUSIÓN

INTRODUCCION

Este proyecto forma parte de la etapa Labs del curso de Data Science de la Academia Soy Henry. En esta ocasión brinda fuentes de información asociadas a las plataformas de streaming, tales como:

  • Amazon Prime Video
  • Disney Plus
  • Hulu
  • Netflix

OBJETIVO

El proyecto consiste en una ingesta de datos de diversas fuentes entregados por la cátedra, para aplicar transformaciones en los datasets que permitan realizar consultas a través de una API. En el siguiente enlace tendrás acceso al repositorio del proyecto original: Statemet Los archivos originales están disponibles en este repositorio: Datasets

SCOPE OF WORK

La propuesta de trabajo se llevará a cabo en las siguientes etapas:

  1. Análisis de datos de exploración (EDA)
  2. Extraer-Transformar y Cargar con Python.
  3. Generación/Creación de una API para realizar consultas con FastAPI
  4. Ejecutar la API en un host local y ejecutar consultas, visualizando con Uvicorn.
  5. Desarrollo de Modelo con Machine Learning
  6. Ajuste de parámetros del modelo
  7. Realización de un deployment en Delta

(https://github.com/RocioAldanaMendez/Streaming_Platforms/tree/main/aseets/Arquitectura.jpg)

ESTADO:

✅ Proyecto finalizado ✅

EDA - ETL


Como paso inicial, los datos se cargarán utilizando la biblioteca pandas. En esta instancia, se realizará un análisis exploratorio de los datos y se realizarán las transformaciones necesarias para limpiar los datos. transformaciones necesarias para la limpieza de datos. Para ver con más detalle el trabajo realizado con las ETD y ETL acceda al siguiente enlace: EDA/ETL

FastAPI

Para la creación de la API se utilizó el archivo main.py. Con eso, se construyó la API localmente y se configuraron las funciones para realizar consultas. La API carga el CSV ya transformado para realizar las consultas y devuelve los resultados esperados.

Para este proyecto solo se solicitaron 4 tipos de consultas.

  • Duración máxima por tipo de película (película/serie), por plataforma y por año: La solicitud debe ser: get_max_duration(año, plataforma, [min o temporada]).

  • Número de películas y series (por separado) por plataforma. La solicitud debe ser: get_count_plataform(plataforma)

  • Número de veces que se repite un género y plataforma con más frecuencia del mismo género y plataforma. La solicitud debe ser: get_listedin('género') Como ejemplo de género, puede usar 'comedia', que debería devolver un coño de 2099 para la plataforma de Amazon.

  • Actor más repetido por plataforma y año. La solicitud debe ser: get_actor(plataforma, año)

DEMOSTRACIÓN:

  • Funcionalidad 1: Consultar película con mayor duración con filtros opcionales de Año, Plataforma y Tipo de duración.
  • Funcionalidad 2: Consultar cantidad de películas por plataforma con un puntaje mayor a XX en determinado año.
  • Funcionalidad 3: Consultar cantidad de películas por plataforma con filtro de Plataforma.
  • Funcionalidad 4: Consultar actor que más se repite según la Plataforma y Año.
  • Demo:

ACCESO AL PROYECTO

        \## 📁 Acceso al proyecto

        **Indica cómo se puede descargar o acceder al código fuente del proyecto, ya sea proyecto inicial o final**

        \## 🛠️ Abre y ejecuta el proyecto

        **Muestra las instrucciones necesarias para abrir y ejecutar el proyecto**

TECNOLOGÍAS

git python

DESARROLLADORES


Rocío Méndez

VIDEO (<7 min)

CONCLUSIÓN

streaming_platforms's People

Contributors

rocioaldanamendez avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.