AT.info ПОСИДЕЛКИ  vKontakte   facebook группа  
RegExp

at.info workshop #2: отчет

Прошла всего лишь неделя от предыдущей практической встречи, и вот мы уже провели вторую. В этот раз мы сделали больше упор на технологии, а не на инструменты автоматизации. 

Мы начали с знакомства и определения уровня собравшейся аудитории. Разъяснили базовые моменты работы Selenium и перешли к основной теме воркшопа - Локаторам.

Мы поддерживаем наш формат 95% практики и лишь 5% теории. Потому, весь материал был подкреплен практическими заданиями, с которыми ребята успешно справились. И ушли домой со всеми материалами, полученными во время встречи. 

Поиск текста в Word фале на Python

Мне надо было создать скрпит, чтобы вытягивал емейлы из вордовских файлов. Задача решена следующим образом:

import os, re, win32com.client

msword = win32com.client.Dispatch('Word.Application')
msword.Visible = 0

try:
	path = "C:\\temp\\"
	files = os.listdir(path)
	files.reverse()
	emailfile = open(path+'emaillist.txt', 'w')
	i=0
	for file in files:
		file = "%s%s" % (path, file)
		doc = msword.Documents.Open(file)
		r=re.search('([\w\-\.]+@(\w[\w\-]+\.)+[\w\-]+)', doc.Content.Text)
		if r is not None:
			email = r.group(0)
			emailfile.write(email+",\n")
			i = i + 1
			print ("["+str(i)+"] "+file+" DONE")
		doc = msword.Documents.Close()	
	msword.Quit()

except RuntimeError as error:
	msword.Quit()
	print ("error = "+error)

Интересует, можно ли было сделать проще?

RSS-материал