vamos no ay que ser tan malos XD
mira espero y te sirva de motivacion ,python es muy facil tienes mucha documentacion en ingles y español, mas en ingles pero no necesitas saber mucho ingles solo lo basico
llevo 5 semanas con este lenguaje y la verdad me a sorprendido demasiado puedes hacer practicamente cualquier cosa y es muy facil la sintaxis.
la verdad es que si es cierto lo que dicen los compañeros de arriba no pidas que te lo hagan trata de avanzar algo y talvez te ayuden .
te recomiendo que entres a pythonya asi buscalo en google te enseñan de una forma interactiva y no necesitas descargar python aprendiendo eso basico casi puedes hacer cualquier cosa
ojo tampoco soy el amo de python tampoco se algunas cosillas
pero leyendo se aprende
aca lo que pides espero y te motive hacer mas cosas en python
ojo necesitas descargar la libreria mechanize y beautifulsoup supongo que usaras windows te bajas este programa para instalar librerias y lo instalas
https://pypi.python.org/packages/2.7/s/setuptools/setuptools-0.6c11.win32-py2.7.exe#md5=57e1e64f6b7c7f1d2eddfc9746bbaf20una vez descargado entras a inicio ejecutar cmd y en cmd buscas el directorio donde tengas guardado python o escribes esto Cd\Python27\Scripts una vez ayas puesto esto escribes easy_install mechanize una vez que se complete de instalar no cierres nada y escribes easy_install beautifulsoup4 y listo procedes con el codigo
ojo el codigo no estan largo lo que esta con # son comentarios no afecta en nada si los borras solo te explica que hace cada cosa
#se importa la libreria mechanize
#mechanize es un emulador de navegador
# se importa la libreria beautifulsoup por que bs4 por que es la version 4 de beautiful
#beautifulsoup es un parseador html para buscar divs y cosas por el estilo que estan en el codigo fuente de la pagina
import mechanize
from bs4 import BeautifulSoup
#declarar el navegador
br = mechanize.Browser()
#se almacena la url de donde extraeremos los datos
url='http://www.cinevk.com/'
#se desactivan los robots de la pagina para que la pagina no piense que somos un bot
br.set_handle_robots(False)
#se agrega el header para que la pagina piense que entramos desde un mozilla linux
br.addheaders = [('User-agent', 'Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.1) Gecko/2008071615 Fedora/3.0.1-1.fc9 Firefox/3.0.1')]
#se abre la url de donde sacaremos esos datos que pides
r = br.open(url)
#se declara una variable con el nombre soup y le decimos que BeautifulSoup es la respuesta de la pagina y que la lea ,la respuesta vendria siendo el codigo html de la pagina
soup = BeautifulSoup(br.response().read())
#con un for le decimos al modulo soup que busque todas las etiquetas <p> y </p>
#recuerda que soup es una variable que almacena al modulo beautifulsoup
for resul in soup.findAll('p'):
# si tu trataras de imprimir resul asi directo del for te saldrian todos los titulos asi <p>ice age 1</p>
#para eso existe el metodo join ,por cierto gracias a Elektro y a Godor por decirme de este metodo jaja
#lo que sucede aqui es que con un print impremes el resultado supongo que si saves para que sirve un print
#bueno con un join tomas al resul del for y buscas con findall todo lo que no sea etiquetas html y lo impremes con print
print ''.join(resul.findAll(text=True))
aqui resultado
si alguien quisiera corregirme en algo son libres de hacerlo tampoco soy una eminencia jaja