Estamos con git, configurando el repositorio
Notas sobre Periodismo de Datos en UC3M
- Periodismo
- Visualización
- Datos
Por Concepción Arenal Ponte
Siguiente párrafo
Notas sobre Periodismo de Datos en UC3M
En la actualidad el periodismo de datos es una parte o versión del periodismo que se encarga de acceder a registros electrónicos que contienen información de interés público (por ejemplo, los niveles de polución en el aire de los barrios obreros, cuentas de un ministerio de defensa o el volúmen del personal sanitario según los distritos de la ciudad) y manejar esos registros para que sean facilmente aprehendidos por los lectores. Para esto último se suele acudir a lo que llamamos visualización de datos, aunque no es imperativo para realizar "periodismo de datos". El periodista se encarga de acceder a la información en bruto, discriminar aquello que no le resulta esencial y trabajar con los datos restantes ya sea para crear una infografía o para redactar una noticia basándose en las cifras que ha escogiod. El objetivo final es que el lector tenga una información sustentada sobre una base fiable (registros hechos por autoridades o personalidades competentes).
Es una forma de presentar de manera gráfica un determinado conjunto de datos para que sea de fácil comprensión a la hora de publicarse. Es convertir los datos brutos en una imagen. El poder visual de las infografías facilita la publicación de reportajes o noticias basadas en datos que manejan muchas cifras. Por ello, en mi opinión, suponen una vía segura para la realización del periodismo de datos, pues generan atractivo y son más "divulgativos" que los párrafos que recurren a procentajes o números.
El periódico en línea "The Guardian" es un medio pionero y de referencia en el periodismo de datos moderno, en especial desde que cuentan con el equipo Datablog formado por Simon Rogers y Paul Brashaw. En el sitio de este medio hay toda una sección denominada "Data" (el Datablog) que se dedica a recopilar los repotajes o noticias del medio que se apoyan en la visualización de datos (gráficos). Esto indica la importancia central que tiene esta parte de la disciplina periodísitca en el medio.
Internet es una red mundial descentralizada de computadoras y servidores, que utilizan la familia de protocolos TCP/IP para intercambiar archivos.
La "web" (o world wide web) es una metáfora para hacer referencia al sistema por el cual se pueden transmitir diversos tipos de datos a través del Protocolo de Transferencia de Hipertextos o HTTP, que son los enlaces de las página web. Este sistema se sirve de Internet.
La web, entonces, forma parte de internet, pero no son una y la misma cosa. Por ejemplo, las aplicaciones instaladas en los móviles son servicios de internet (o que se sirven de internet) que no pertenecen a la World Wide Web.
El periodismo de datos moderno o actual nace en la primera década del siglo XXI debido a una combinación de factores: abundancia de software de código abierto, mayor fuerza del movimiento del software libre y Open Data y la expansión del acceso a internet.
Hay tres áreas implicadas en el periodismo de datos:
a) El periodismo, y por lo tanto la investigación.
b) Los datos, es decir, registros electrónicos que han de ser tratados por ordenador.
c) La visualización de datos: desde la web hasta el papel pasando por la estadística, las distintas visualizaciones o la infografía: diagramas o figuras que buscan resumir o explicar figurativamente una información o un texto.
El periodismo de datos es una especialidad de la disciplina [periodística] que se encarga de analizar y filtrar datos (especialmente si se trata de grandes cantidades) a través de herramientas (software) especializadas con el objetivo de divulgar esta información de la manera más accesible al público. Por este motivo se tienden a usar infografías, visualizaciones de datos y aplicaciones interactivas que acerquen la información original a la mayoría de lectores.
Entre los tipos de datos que podemos encontrar están los numéricos, los booleanos, las cadenas de caracteres y los datos nulos. Dentro de los datos numéricos podemos encontrar los siguientes:
a) Números enteros: datos que son números enteros sin decimales
b) Floats o números decimales
c) Números periódicos
d) Fechas: números que indican fechas y suelen seguir el esquema de YYYY-MM-DD (año, mes y día, respectivamente). Para los años se ponen 4 cifras (de momento) y para los meses y días dos.
Entre los datos que no son numéricos están los booleanos, que consisten en dos opciones mutuamente excluyentes (sí/no, 1/0, verdadero/falso); las cadenas de caracteres de texto son cualquier tipo de dato que no sea una fecha, un número, un booleano o un dato nulo (los asistentes a una fiesta, los miembros de un comité o un equipo, los barrios de una ciudad, etc) y son los datos más frecuentes; los datos nulos son valores desconocidos o indefinidos y solo pueden tener el valor de "nulo".
Es un modelo de diseño de software en el que las tareas se reparten entre los proveedores de recursos o servicios, llamados servidores, y los demandantes, llamados clientes. Un cliente realiza peticiones a otro programa, el servidor, quien le da respuesta. Un ejemplo de una red cliente-servidor es el uso del correo electrónico de un ISP para enviar, recibir y almacenar correos electrónicos. El cliente de correo electrónico en una PC doméstica solicita al servidor de correo electrónico del ISP para que se le envíe todo correo no leído.
Microsoft Excel es un programa informático para visualizar datos tabulados y trabajar con estos. CSV es un formato de datos y su nombre indica que estos valores están separados por comas. La relación está en que Excel puede abrir y operar con archivos en formato CSV. Excel también es una serie de formatos de archivos de datos (.xltx, .xls, .xlsx, .xlsm) y un archivo .csv puede ser convertido a un archivo excel.
El uso que Philip Meyer hizo de una computadora central en su noticia sobre los disturbios de detroit y la probabilidad que tenían de participar en ellos universitarios y personas que abandonaron la escuela secundaria.
Las tecnologías que componen una página web son html (el lenguaje de programación con el que se escribe el contenido de la página web), el css (los archivos que controlan el estilo de la página) y los archivos javascript (el lenguaje de programación encargado de dar interactividad a la página web).
Usaría el comando "wget -r" y a continuación pegaría la URL de theguardian.com.
Para saberlo escribí el comando "$SHELL --version" y en la terminal se me indicó que mi versión de SHELL es GNU bash, version 4.4.12(3)-release (x86_64-unknown-cygwin).
Para saber el valor de "PATH", necesito indicarle al comando “echo” que se trata de una variable. Para ello, escribo en la terminal "echo $PATH", donde el símbolo del dólar es lo que indica que se trata de una variable de entorno.
Su valor es: /usr/local/bin:/usr/bin:/cygdrive/c/Program Files (x86)/Common Files/Oracle/Java/javapath:/cygdrive/c/Windows/system32:/cygdrive/c/Windows:/cygdrive/c/Windows/System32/Wbem:/cygdrive/c/Windows/System32/WindowsPowerShell/v1.0:/cygdrive/c/Windows/System32/OpenSSH:/cygdrive/c/Program Files (x86)/NVIDIA Corporation/PhysX/Common:/cygdrive/c/Program Files/NVIDIA Corporation/NVIDIA NvDLISR:/cygdrive/c/Program Files/Git/cmd:/cygdrive/c/Program Files/Pandoc:/cygdrive/c/Users/X571/AppData/Local/Microsoft/WindowsApps
El primer comando que usaría sería "pwd" (sin comillas) para saber en qué parte de mi ordenador estoy y, a partir de allí, moverme hacia donde quiero ir o hacer lo que quiero hacer (si estoy donde quiero estar).
Los comandos más útiles que uso para moverme entre directorios a través de la terminal cygwin es "cd" y "ls": con el primero puedo cambiar de directorio y con el segundo puedo ver los ficheros que hay en cada uno de ellos y así moverme a los directorios presentes o abrir los archivos que necesito. También me apoyo en las ubicaciones exactas de los directorios para aprovechar y moverme a ellos con el comando cd. Un ejemplo sería la siguiente construcción: "cd /cygdrive/c/Users/X571/Desktop/periodismo-datos/uc3m-periodismo-datos".
Abriría la terminal y con el comando cd iría al directorio en el que quiero clonar el repositorio (o sino lo creo con el comando mkdir), después me iría al sitio donde está el repositorio que quiero clonar,escribo el comando git clone y al lado copio el código https del repositorio (dejando un espacio en medio). Para comprobar que ha funcionado escribiría el comando ls para comprobar que todos los ficheros del repositorio git están ya en mi ordenador.
Con el comando mkdir se pueden crear directorios en cygwin. Para crearlo escribimos dicho comando y a continuación el nombre que queremos darle. Si queremos dos directorios escribimos el nombre del primero,luego una coma, dejamos un espacio y luego escribimos el nombre del segundo. Por ejemplo: "mkdir carpetas-css, carpetas-html5" crearía un directorio llamado "carpeta-css" y otro con el nombre "carpeta-html5".
Si estamos en Cygwin debemos utilizar el comando ls -l para ver todos los archivos de un directorio organizados en forma de lista según sus atributos
La diferencia están en que la ruta absoluta incluye toda la ruta de un fichero, incluyendo el directorio raíz. La ruta relativa indica la ubicación del fichero a partir de donde esté el usuario en ese momento.
Ejemplos:
Ruta absoluta:
C:/cygdrive/c/Users/X571/Desktop/periodismo-datos/uc3m-periodismo-datos
Ruta relativa: si estuvieramos dentro de un directorio llamado "Carpeta páginas web" y queremos acceder al archivo .css llamado "estilo fuego.css" que se halla dentro del directorio "estilos-css" la ruta sería la siguiente
/estilos-css/estilo fuego.css
En markdown sirve para jerarquizar encabezamientos: cuantas más almohadillas, de menor tamaño será el encabezamiento que le siga (es como la función del h1 en html). En el programa shell la almohadilla al principio de una línea indica que esta está comentada.
a) Las comillas dobles para que te aparezan resultados que contengan exactamente lo que esté contenido dentro de ellas. (“”)
b) SITE: (para buscar en una página web concreta) ej: awe site:guardian
c) AND (busca páginas que incluyan los elementos que se indique)
d) DEFINE: (busca la definición de una palabra). Ej: define:trampear
e) OR : muestra resultados que tengan las palabras incluidas. Palo or tecla or teclado
Abriría la terminal y con el comando cd iría al directorio en el que quiero clonar el repositorio (o sino lo creo con el comando mkdir), después me iría al sitio donde está el repositorio que quiero clonar, escribo el comando git clone y al lado copio el código https del repositorio (dejando un espacio en medio). Para comprobar que ha funcionado escribiría el comando ls para comprobar que todos los ficheros del repositorio git están ya en mi ordenador.
Una vez instalado el programa pandoc.exe lo que tenemos que hacer desde cygwin es escribir el siguiente comando:
pandoc archivo.md -o archivo.html
Aparte del formato, se puede cambiar el nombre del archivo después de "-o"
Para moverme entre ficheros y directorios dentro de la terminal. Y asea usando rutas relativas o absolutas después de dejar un espacio entre la ruta y el comando. Ej:
cd /cygdrive/c/Users/X571/Desktop/periodismo-datos/uc3m-periodismo-datos
API significa ACCESS PROGRAMMING INTERFACE o interfaz de programación de acceso, es un sistema de códigos para establecer comunicación entre equipos o entre software. HTTP es una API universal, pero luego cada recurso puede tener la suya propia.
Un ejemplo es la API son los bots de Twitter que emiten mensajes automatizados.
Microsoft Excel es un programa informático para visualizar datos tabulados y trabajar con estos. CSV es un formato de datos y su nombre indica que estos valores están separados por comas. La relación está en que Excel puede abrir y operar con archivos en formato CSV. Excel también es una serie de formatos de archivos de datos (.xltx, .xls, .xlsx, .xlsm) y un archivo .csv puede ser convertido a un archivo excel.
Valores separados por tabulaciones
El comienzo del CAR se data alrededor de 1952, cuando la televisión CBS usó una computadora UNIVAC I para analizar los resultados electorales de la presidencia de de EE. UU. Uno de los primeros ejemplos prácticos se produjo también en 1967, después de los disturbios en Detroit, cuando Philip Meyer, de Detroit Free Press, usó una computadora central para mostrar que las personas que habían asistido a la universidad tenían la misma probabilidad de haberse amotinado que los que abandonaron la escuela secundaria.
El primer paso sería abrir la terminal y con el comando cd ir al directorio en el que quiero clonar el repositorio (o sino lo creo con el comando mkdir), después me iría al sitio donde está el repositorio que quiero clonar, escribo el comando git clone y al lado copio el código https del repositorio (dejando un espacio en medio). Para comprobar que ha funcionado escribiría el comando ls para comprobar que todos los ficheros del repositorio git están ya en mi ordenador.
Estando en windows, ante ese mensaje entiendo que el comando no está instalado y, en consecuencia, escribo el comando apt-cyg install "nombre-del-comando" para tenerlo.
He entendido de una manera más profunda la arquitectura de una página web (con los archivos css y html), sus componentes y las posibilidades del software libre
He aprendido a moverme con mayor velocidad tanto dentro de la propia máquina (con la terminal) como dentro de internet
Es un periodista pionero del CAR (computer assisted reporting) que en 1967 utilizó una computadora central para demostrar que, en los disturbios de detroit, había la misma probabilidad de que asistieran tanto personas que habían abandonado la escuela secundaria como universitarios.
Fue una enfermera y estadística nacida en Florencia (1820) considera pionera en la visualización de datos por su diagrama que presentaba las causas de mortalidad del ejército este en la guerra de crimea.
Hola, me gustaría saber si se puede actualizar un documento de Github a partir de la terminal, abriendo el documento con nano y aplicando algún tipo de comando; en el caso de que se pueda, ¿cómo se haría?
Te adjunto el enlace del examen subido a mi repositorio: https://github.com/azaharaserrano/Periodismo-datos/blob/main/examen-datos.md
Muchas gracias.
¡Un saludo!
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.