Google+ Seguidores

viernes, 7 de abril de 2017

Lector de RSS en Python usando feedparser

En esta entrada lo que aprenderemos será el uso de un módulo de python el cual se llama feedpareser, con el que podremos tener acceso a la lectura de feeds (rss) mediante python.

Lector de RSS en Python usando feedparser

Hoy veremos como obtener los rss del blog de manera simple, para ello utilizaremos la consola, pero con unos pequeños cambios podremos adaptarlo a nuestras necesidades, por ejemplo utilizando GUI, exportarlos a una planilla Excel, guardarlos en Google Drive, etc

Autor de la entrada: noxonsoftware
Email: noxonsoftwares0@gmail.com
Blog: noxonsoftwares.blogspot.com

Lector de RSS en Python usando feedparser


Para que el script funcione es necesario tener instalado el módulo feedpareser, esto se puede hacer mediante: pip install feedparser
Si no tienes instalado PIP y no sabes como hacerlo, puedes pasarte por esta entrada: Como instalar pip en Linux y Windows

#!/usr/bin/env python
# -*- coding: utf-8 -*-

# Lo primero que hacemos es importar el modulo feedparser:
import feedparser

url = 'http://feeds.feedburner.com/MiDiarioPython'

# delcaramos que es lo que leera el feedparser
rss = feedparser.parse(url)

# recorremos todos los post que aparecen en el RSS
# para luego mostrar solamente el titulo y el link

for post in rss.entries:
 print(post.title + ":" + post.link)

# de caso contrario si solo queremos ver el primer post
# lo que hacemos sera colocar de la siguiente manera
# siendo que todo esta indexado

# esto nos mostrara la primer entrada
print(rss.entries[0]['title'])

# si queremos ver la segunda entrada seria de la siguiente manera
print(rss.entries[1]['title'])

# ahora si queremos ver solamente el link de la segunda entrada 
# seria de la siguiente manera
print(rss.entries[1]['link'])

# viendo el titulo y el link de la segunda entrada
entrada = rss.entries[1]
print(entrada.title + " - " + entrada.link)

3 comentarios :
Write comentarios
  1. # viendo el titulo y el link de la segunda entrada
    #print(rss.entries[1]['title']['link'])

    Traceback (most recent call last):
    File "C:/Users/i3 1470/Desktop/feed.py", line 34, in
    print(rss.entries[1]['title']['link'])
    TypeError: string indices must be integers

    ResponderEliminar
    Respuestas
    1. Hola, muchas gracias por reportarlo!!! Ya fue correjido
      Saludos y gracias por visitar el blog

      Eliminar

Tu comentario es importante y nos motiva a seguir escribiendo...

Entradas más recientes

Powered by Blogger .