Tweepy para extraer tweets de Twitter

tweepy

Extrayendo datos de Twitter usando Python

Usando Tweepy para extraer tweets de Twitter

Tweepy


Ahora que todo se hace en línea, los datos compartidos en las plataformas de redes sociales han aumentado exponencialmente. Con estos datos podemos analizar varios factores socioeconómicos que prevalecen actualmente y muchos más. Aquí hay una forma de extraer tweets basados en ciertos temas de la API de Twitter usando la biblioteca Tweepy.

Para utilizar la API de Twitter, debe tener una cuenta de Twitter con acceso de desarrollador. Solicitar el mismo puede tomar de 2 a 3 horas para obtener una aprobación. Una vez que haya terminado con la configuración, cree una aplicación, en ella, obtendrá claves y tokens, que nos ayudarán a recuperar datos de Twitter. Actúan como credenciales de inicio de sesión.

Image for post

Ahora, pasaremos al código para obtener los tweets. Primero, debe importar todos los paquetes necesarios e inicializar el token y las variables clave. OAuth esencialmente permite que el usuario, a través de un proveedor de autenticación con el que se haya autenticado previamente con éxito, otorgue a otro sitio web / servicio un token de autenticación de acceso limitado para la autorización de recursos adicionales.

tweepy

Después de obtener acceso a los datos de Twitter, ahora crearemos un archivo para guardar todos los tweets en él.

tweepy

Ahora crearemos un filtro que extraerá tweets basados en ciertas palabras que se mencionan. Básicamente, extraerá tweets que contengan las palabras válidas para nuestro proyecto. Por ejemplo, si desea datos sobre covid19, utilizará palabras específicas como corona, coronavirus, covid19, etc. para filtrar los tweets como se muestra a continuación.

tweepy

Puede leer los tweets almacenados en el archivo de la siguiente manera: –

tweepy

Image for post

El resultado de lo anterior es información sin refinar con marcas de tiempo y ciertos identificadores que Twitter podría usar. Necesita limpiar los datos para usarlos en su proyecto. Para limpiar los datos, hay pasos a seguir, como la eliminación de palabras no deseadas, el análisis de textos, la eliminación de signos no deseados, la tokenización y mucho más. “Limpiar los datos” es una historia para otro momento.

Puede utilizar el formato anterior para obtener datos para cualquiera de sus proyectos, ya sea campaña electoral, problemas ambientales, el mercado de valores o sobre lego. Hay muchos problemas que se pueden analizar con el poder de Twitter. Solo necesita agregar palabras relacionadas o hashtags y listo, ¡está listo para profundizar en su proyecto!

No dude en compartir sus comentarios para que pueda corregirlos en caso de error. Estoy aquí para compartir mi trabajo y aprender cosas nuevas.

Recent Post