Este livro está em Revisão aberta. Suas impressões são importantes para torná-lo melhor para você e para outros estudantes. Você pode anotar alguns textos selecionando-os com o cursor e clicando no menu popup. Você também pode ler anotações de outras pessoas: Clique no canto superior direito da página

2.5 Leitura dos html (parseamento)

Após baixar as páginas, montamos scripts para extrair os dados dos htmls e organizá-los em tabelas. Esses scripts foram montados e um subproduto da tese é justamento a criação de um conjunto de funções para automatizar o processo de coleta, leitura e organização dos dados do STF.