TECNICAS Y METODOS DE INVESTIGACION DIGITAL zadquiel

 INTRODUCCIÓN

En la última década ha surgido un fuerte interés por el uso de los contenidos generados por los usuarios de las redes sociodigitales para la investigación social, lo que pone el acento en su doble función: por un lado, constituyen una fuente primaria que permite estudiar las tendencias que la opinión pública expresa, en general, en las diferentes plataformas sociales, además de que permiten comprender la compleja lógica de las plataformas sociales como nuevos medios de comunicación En este contexto emergen varios programas de investigación, dentro de los que se destacan la iniciativa de métodos digitales y la iniciativa de estudios del software . Ambas se enfocan en el estudio de objetos digitales con métodos digitales, por lo que se ubican en la intersección entre los estudios de medios y las ciencias informáticas.

En relación con análisis anteriores sobre las prácticas y entornos digitales, como la etnografía digital , estas metodologías mueven el foco de estudio de las prácticas de los usuarios a los objetos que estos producen. Además de este desplazamiento, los métodos digitales suponen la incorporación de nuevos conceptos, habilidades y técnicas de investigación. 




EL SCRAPTING COMO TECNICA DE RECOLECCIÓN DE DATOS

El scraping es una técnica específica del medio digital que permite la recolección automática de datos en línea. Es una de las técnicas más representativas de los métodos digitales actuales, ya que posibilita la investigación basada en datos en el medio digital. Mediante esta técnica se recuperan datos crudos que, si bien están estructurados en el sitio web al que pertenecían de manera original, necesitarán de una nueva organización para poder ser leídos e interpretados y convertirse en información relevante para la investigación. Mediante la ejecución de un software desarrollado para este fin, y a partir del propósito del estudio, podremos recuperar diferentes tipos de datos: desde los que se encuentren en un informe en PDF para verterlos en una hoja de cálculo, un conjunto de imágenes publicadas en una red social, los tuits que se hayan escrito sobre algún acontecimiento o los metadatos de un conjunto de videos almacenados en YouTube.

Existen tres clases de scraping: el screen and interface scraping, el crawler scraping y el API scraping. El primero es el más antiguo; se trata de un método automático usado para extraer datos que han sido diseñados para ser vistos primariamente por humanos. El programa lee la pantalla y simula ser un humano, y colecciona los datos interesantes en listas que pueden ser procesadas de manera automática. Se basa en la extracción de datos del código HTML visualizado en las interfaces de usuario, lo que significa que los datos son formateados y personalizados para usuarios particulares.













Un ejemplo de screen scraping es el de la extensión Bulk Media Downloader, complemento montado sobre el navegador Firefox. Después de ser instalado, el usuario puede bajar todos los contenidos que ve en su pantalla y almacenarlos en su computadora. Pero como las bú

squedas en las plataformas sociales y los sitios web son personalizadas, lo que el usuario recolecta es información sesgada por su experiencia.
El crawler scraping extrae la estructura de un sitio web, además de los datos que las bases de datos asociadas al sitio pueden contener. El tercer tipo de scraping, habitualmente el más utilizado, es el basado en consultas a las interfaces de programación de aplicaciones, conocidas como API (Application Programming Interfaces). En este caso, los datos se encuentran estructurados en una base de datos en función de los intereses de las plataformas que los almacenan. Por este motivo, deberemos recurrir a las API; estas consisten en un conjunto de algoritmos, funciones y procedimientos que ofrece una plataforma para ser utilizada por otro software que solicitará información. Constituyen una herramienta central en el proceso, ya que representan la capacidad de comunicación entre la base de datos de la plataforma que brinda la información y el programa que la recolecta.













Si la plataforma no habilita su API para recolectar información, no podremos obtener sus datos, al menos a través de esta. En general, las plataformas habilitan sus API para que los desarrolladores independientes creen nuevas aplicaciones para los datos, pero no para extraer información a fin de ser analizada; por ejemplo, Facebook habilita sus API para la creación de videojuegos, encuestas y aplicaciones de publicidad y marketing, pero no para la exportación de datos.

Comentarios

Entradas más populares de este blog

INTELIGENCIA ARTIFICIAL JIMENA Y AXEL

PAGUINAS WEB VALENTINA Y KARLA

TÉCNICAS Y MÉTODOS DE INVESTIGACIÓN DIGITAL 2 BB