Скрипт выдёргивает все ссылки на видео из превью для курсеры и складывает их в файл

import urllib
import re

outputhtml = open('course-download.html' ,'w')

mainpage = urllib.urlopen("https://class.coursera.org/algo2-2012-001/lecture/preview");
mainpage_contents = mainpage.read()

allvideos = re.findall('(".*?lecture_id.*?")', mainpage_contents)

for vid_each in allvideos:
    vid = vid_each[1:-1]
    vidcontent = urllib.urlopen(vid).read()

    vidtitle = re.findall('<div id="lecture_title" class="hidden">(.*?)</div>', vidcontent)
    if (len(vidtitle) > 0):
        vidtitle = vidtitle[0]
    else:
        continue

    vidurl = re.findall('"([^"]*?\.mp4)"', vidcontent)
    if (len(vidurl) > 0):
        vidurl = vidurl[0]
    else:
        continue

    vidsub = re.findall('src="(.*?subtitles.*?_en)"', vidcontent)
    if (len(vidsub) > 0):
        vidsub = vidsub[0]
    else:
        vidsub = ''

    outputhtml.write(vidurl + ' ' + vidsub + '\n')
    print vidtitle

outputhtml.close()

Оригинал: [1]