Março 2016 vol. 2 num. 3 - VIII Escola Brasileira de Linguística Computacional & XIII Encontro de Linguística de Corpus
Artigo Completo - Open Access.
A “otimização dos mecanismos de busca” (SEO) como ferramenta de coleta automatizada de documentos para elaboração de corpora
MIROIR, Jean-Claude ;
Artigo Completo:
Este trabalho fundamentou-se no quadro teórico desenvolvido nos “Estudos da Tradução embasada em Corpora” (Corpus-Based Translation Studies) (Baker, 1993; Laviosa, 2002; Olohan, 2004; Zanettin, 2012; Vania e Tagnin, 2015). A metodologia de “otimização dos mecanismos de busca” (SEO – Search Engine Optimization) (Enge et al., 2012) foi desenvolvida para elaborar, sem conhecimentos especializados em informática, corpora comparáveis (Olohan, 2004; Zanettin, 2012) de forma rápida e confiável. Com efeito, este estudo visou reduzir de forma significativa o “ruído” (conjunto de documentos irrelevantes) gerado na coleta automatizada de documentos por meio de ferramentas específicas. Os procedimentos da “otimização dos mecanismos de busca” (SEO) implementados permitiram o aproveitamento de todo o potencial dos recursos disponíveis nas configurações da “pesquisa avançada” dos mecanismos de busca como o Google Search Engine e dos “operadores de pesquisa”. A melhora da qualidade dos resultados gerados por essa metodologia de pesquisa agilizou a produção dos corpora customizados (Perrotti-Garcia, 2005) ou dos DIY [Do-It-Yourself] Corpora (Zanettin, 2002), criados a partir da conversão em lotes dos corpora comparáveis. Esses procedimentos rápidos e eficientes resultaram na (re)valorização do uso desses tipos de corpora “ad hoc” no fluxo de trabalho do tradutor profissional e do aprendiz, contribuindo no melhoramento da qualidade do produto final: a tradução.
Artigo Completo:
This work was based on the theoretical framework developed in the Corpus-Based Translation Studies (Baker, 1993; Laviosa, 2002; Olohan, 2004; Zanettin, 2012; Vania e Tagnin, 2015). The methodology of “search engine optimisation” (SEO) (Enge et al. 2012) was developed to prepare comparable corpora without expertise in computer science (Olohan, 2004; Zanettin, 2012) quickly and reliably. Indeed, this study aimed to significantly reduce the “noise” (set of irrelevant documents) generated in the automated collection of documents by means of specific tools. The “search engine optimisation” (SEO) procedures implemented allowed the use of the full potential of available resources in the search engines “advanced search” settings such as Google Search Engine and “search operators”. Improving the quality of the results generated by this research methodology facilitated the production of customised corpora (Perrotti-Garcia, 2005) or DIY (Do-It-Yourself) Corpora (Zanettin, 2002), created from the conversion in batches of comparable corpora. These fast and efficient procedures resulted in the (re)valuation of the use of these types of “ad hoc” corpora in the workflow of the professional translator and the apprentice, contributing to the improvement in quality of the final product: the translation.
Palavras-chave: Tradução embasada em Corpora, Otimização dos mecanismos de busca (SEO), Coleta automatizada de documentos, Corpus comparável, Corpus customizado,
Palavras-chave: Corpus-Based Translation, Search Engine Optimisation (SEO), Automated collection of documents, Comparable corpus, Customised corpus,
DOI: 10.5151/sosci-viiieblc-xiii-elc-08_artigo_05
Referências bibliográficas
- [1] BAKER, Mona. et al. Text and technology in honour of John Sinclair. Philadelphia: J. Benjamins Pub. Co., 1993.
- [2] BERNARDINI, Silvia; BARONI, Marco. BootCaT: Bootstrapping corpora and terms from the web. Proceedings of the 4th International Conference on Language Resources and Evaluation (LREC 2004), 26-28 May 2004, Lisbon, Portugal, 1313-1316.
- [3] BIBER, Douglas; PINTO, Marcia Veirano; SARDINHA, Tony Berber (Org.). Multi-dimensional analysis, 25 years on: a tribute to Douglas Biber. Studies in Corpus Linguistics (SCL), volume 60. Amsterdam ; Philadelphia: John Benjamins Publishing Company, 2014.
- [4] CALIARI, Vinícius; ROSIER, Jean Pierre; BORDIGNON-LUIZ, Marilde. VINHOS ESPUMANTES: MÉTODOS DE ELABORAÇÃO. Evidência - Ciência e Biotecnologia, [S.l.], v. 13, n. 1, p. 65-77, mar. 2013.
- [5] CIMERMANOVÁ, Ivana. Corpus vs dictionary in EFL classes. In: KAČMÁROVÁ, Alena (Org.). English Matters III. Prešov (República Eslovaca): Editora da Universidade de Prešov, 2012, p. 65-73.
- [6] ENGE, Eric. et al. A Arte de SEO: Dominando a Otimização dos mecanismos de busca. Tradução de Tibério Novais e Rafael Zanolli. São Paulo: Novatec, 2012.
- [7] FERNEDA, Edberto. Introdução aos Modelos Computacionais de Recuperação de Informação. Rio de Janeiro: Editora Ciência Moderna, 2012.
- [8] LAVIOSA, Sara. Corpus-based translation studies: theory, findings, applications. Amsterdam; New York, NY: Rodopi, 2002.
- [9] OLOHAN, Maeve. Introducing corpora in translation studies. London; New York: Routledge, 2004.
- [10] PERROTTI-GARCIA, Ana Julia. O Uso de Corpus Customizado como Fonte de Pesquisa para Tradutores. Confluências Revista de Tradução Científica e Técnica, Lisboa, v. 3, p. 62-79, 2005.
- [11] SARDINHA, Tony Berber. Linguística de Corpus: histórico e problemática. DELTA: Documentação de Estudos em Lingüística Teórica e Aplicada, Pontifícia Universidade Católica de São Paulo - PUC-SP, v.16, n.2, p.323-367, 2000.
- [12] ______. Corpora eletrônicos na pesquisa em tradução. Cadernos de Tradução, Florianópolis, v. 1, n. 9, p. 15-59, jan. 2002.
- [13] VIANA, Vander; TAGNIN, Stella (Org.). Corpora no ensino de línguas estrangeiras. São Paulo: Hub Editorial, 2011.
- [14] ______. Corpora na tradução. São Paulo: HUB Editorial, 2015.
- [15] ZANETTIN, Federico. DIY Corpora: The WWW and the Translator. In: MAIA, Belinda; HALLER, Jonathan; URLRYCH, Margherita (Org.). Training the Language Services Provider for the New Millennium, Porto: Faculdade de Letras, Universidade do Porto, 2002, p. 239-248.
- [16] ______. Translation-Driven Corpora Corpus: Resources for Descriptive and Applied Translation Studies. Hoboken: Taylor and Francis, 2012.
Como citar:
MIROIR, Jean-Claude; "A “otimização dos mecanismos de busca” (SEO) como ferramenta de coleta automatizada de documentos para elaboração de corpora", p. 48-78 . In: Anais do EBRALC 2015 & ELC 2015 [=Blucher Social Science Proceedings, n.3 v.2].
São Paulo: Blucher,
2016.
ISSN 2359-2990,
DOI 10.5151/sosci-viiieblc-xiii-elc-08_artigo_05
últimos 30 dias | último ano | desde a publicação
downloads
visualizações
indexações