Google+ Seguidores

sábado, 28 de octubre de 2017

Extrayendo infromación de Wikipedia con Python

Introducción:

En el día de hoy, usaremos la API de la enciclopedia más grande de Internet, Wikipedia, el servicio de Wikipedia es totalmente gratis y no necesitamos una API KEY, esta es una de las ventajas, la otra, es que podemos obtener una gran cantidad de información.

Lo que haremos sera crear un pequeño programa que pida una cadena de texto como entrada la cual buscara en la base de datos de Wikipedia, nos devolverá un en un formato JSON la información referente a la palabra ingresada.


Resultado de imagen para wikipedia


Usando la API de Wikipedia:

Como sabran, una API es un servicio web, para hacer una peticion nesecitamos una libreria que se especialize en estas cosas de la peticiones. Por elección propia usare el modulo "Requests", si quieres descargar el modulo usado en este articulo, ingresa al siguiente enlace: Descargar Requests.

Una vez tengamos el modulo que haga la peticion, podemos comenzar con el desarrollo del nuestro pequeño programa.

Lo primero que hara nuestro programa es importar la libreria requests, seguido de esto el programa pedira una cadena de texto como entrada, esta cadena de texto sera la palabra clave que wikipedia buscara en su base de datos, Veamos como queda:


import requests

s = str(input("Buscar en Wikipedia: "))

params = {'search':s}


Como pueden observar, a cabo de asignar un diccionario con el identificador params, el diccionario tiene un elemento llamada search con el valor ingresado por el usuario, este parámetro sera el que le diga a wikipedia: "Quiero que busques esto en tu base de datos".

Ahora es momento de realizar nuestra petición.


response = requests.get("https://es.wikipedia.org/w/api.php?action=opensearch", params=params)


Con el metodo requests.get realizamos la petición a la API, la url de la API es: https://es.wikipedia.org/w/api.php?action=opensearch.

Como pueden observar estoy asignando params=params, con esto le doy el valor ingresado por el usuario a la url de la API, esto esto se guarda en una variable llamada response.


Luego de este procedimiento le diremos al programa que la respuesta retornada por el servidor sea tratada como formato JSON, requests nos proporciona un método para cumplir con este objetivo, veamos como es:



rj = response.json()


Muy bien, ya tenemos nuestra respuesta, y hasta la hemos estado modificando, es momento de mostrarla, mostrare todos los datos con ayuda de un bucle:


for x in rj:
 print(x)


El resultado seria el siguiente:



Como pueden ver, e ingresado "tiburon" para que wikipedia lo buscara en su base de datos, y luego me a devuelto toda la información que pudo.

Es una API muy interesante a la cual se le pueden dar muchos uso, envíanos tus proyectos realizados con esta API y comparte tu experiencia. Mi nombre es Luis, y fue un placer compartir mis conocimientos con todos ustedes :D.



No hay comentarios :
Write comentarios

Tu comentario es importante y nos motiva a seguir escribiendo...

Entradas más recientes

Powered by Blogger .