Simpósio de Pesquisa Operacional e Logística da Marinha - Publicação Online
- Todas as edições
- Última edição
- Equipe de Produção
- ISSN 2175-6295
UM MÉTODO PARA CLASSIFICAÇÃO DE DADOS BASEADO NOS K-VIZINHOS MAIS PRÓXIMOS PARA O RECONHECIMENTO DE CARACTERES
UM MÉTODO PARA CLASSIFICAÇÃO DE DADOS BASEADO NOS K-VIZINHOS MAIS PRÓXIMOS PARA O RECONHECIMENTO DE CARACTERES
Semaan, Gustavo Silva; Nascimento, Ênio de Oliveira; Henrique, Lubert; Corrêa, Débora Alvernaz; Brito, José André de Moura
Artigo Completo:
Os avanços constantes na Tecnologia da Informação proporcionaram um aumento significativo no volume de dados. Nas corporações é impraticável relacionar uma melhora de qualidade e/ou aumento na produção de bens e serviços sem investimentos em Tecnologia da Informação. Fonte de intensa pesquisa, o reconhecimento de padrões ainda apresenta vários problemas, seja no reconhecimento de caracteres manuscritos, caracteres impressos ou imagens. As dificuldades mais evidentes para análises estão relacionadas ao grande volume de dados associados às abordagens tradicionais de extração de informação ou à natureza complexa de dados em conjuntos de bases menores. Diante desse cenário exemplificador podemos observar o clássico algoritmo de classificação k-NN. Uma nova abordagem para o algoritmo k-NN é proposta com o objetivo de tornar a classificação de dados para reconhecimento de caracteres mais eficaz. Esta abordagem pode trazer benefícios tanto para sociedade no uso em aplicações tecnológicas, como para a comunidade científica.
Os avanços constantes na Tecnologia da Informação proporcionaram um aumento significativo no volume de dados. Nas corporações é impraticável relacionar uma melhora de qualidade e/ou aumento na produção de bens e serviços sem investimentos em Tecnologia da Informação. Fonte de intensa pesquisa, o reconhecimento de padrões ainda apresenta vários problemas, seja no reconhecimento de caracteres manuscritos, caracteres impressos ou imagens. As dificuldades mais evidentes para análises estão relacionadas ao grande volume de dados associados às abordagens tradicionais de extração de informação ou à natureza complexa de dados em conjuntos de bases menores. Diante desse cenário exemplificador podemos observar o clássico algoritmo de classificação k-NN. Uma nova abordagem para o algoritmo k-NN é proposta com o objetivo de tornar a classificação de dados para reconhecimento de caracteres mais eficaz. Esta abordagem pode trazer benefícios tanto para sociedade no uso em aplicações tecnológicas, como para a comunidade científica.
Palavras-chave:
DOI: 10.5151/spolm2019-204
Referências bibliográficas
- [1] CARVALHO, J V; SAMPAIO, M C; MONGIOVI, G. Utilização de Técnicas de “Data Mining” para o Reconhecimento de Caracteres Manuscritos. 1999. XIV Simpósio Brasileiro de Banco de Dados, 1999, Florianópolis. Anais…Florianópolis, 1999. [2] FAYYAD, U. M.; PIATETSKY–SHAPIRO, G.; SMYTH, P. Knowledge Discovery and Data Mining: Towards a Unifying Framework, In Proceeding of the Second International Conference on Knowledge Discovery and Data Mining (KDD-96), Portland, Oregon, august, 1996. [3] GOLDSCHMIDT, R.; PASSOS, E. Data Mining: Um Guia Prático. Rio de Janeiro: Elsevier. 2005. 271p. [4] MIRANDA, R. A. R. et al. Algoritmo para o Reconhecimento de Caracteres Manuscritos, 2013. [5] SILVA, F. A. et al. Reconhecimento de Caracteres Baseado em Regras de Transição entre Pixels Vizinhos, 2011. [6] SILVA, L. A. Mineração de Dados: Uma abordagem introdutória e ilustrada. São Paulo, SP: Editora Mackenzie, 2015. 154p. [7] SILVA, L. S. Distinção Automática de Texto Impresso e Manuscrito em uma Imagem de Documento. 2009. 100f. Dissertação (Mestrado em Computação) - Universidade Federal Fluminense, Niterói. 2009. [8] TAN, P.; STEINBACH, M.; KUMAR, V. Introdução ao data mining, Mineração de Dados. Rio de Janeiro, Ciência Moderna, 2009. [9] Site ics.uci.edu, Optical Recognition of Handwritten Digits DataSet .University of California, 01/07/1998. Disponível em <https://archive.ics.uci.edu/ml/datasets/Optical+Recognition+of+Handwritten+Digits> Acessado em 02/05/2019. [10] Site cs.waikato.ac.nz, The online appendix on the WEKA workbench for the fourth edition of "Data Mining: Practical Machine Learning Tools and Techniques" by I.H. Witten, Eibe Frank, Mark A. Hall, and Chris J. Pal., Disponível em <http://www.cs.waikato.ac.nz/ml/weka/Witten_et_al_2016_appendix.pdf>Acessado em 02/05/2019. [11] Z. Sun, L. Jin, Z. Xie, Z. Feng and S. Zhang, "Convolutional Multi-directional Recurrent Network for Offline Handwritten Text Recognition," 2016 15th International Conference on Frontiers in Handwriting Recognition (ICFHR), Shenzhen, 2016. [12] C. T. Nguyen and M. Nakagawa, "Finite State Machine Based Decoding of Handwritten Text Using Recurrent Neural Networks," 2016 15th International Conference on Frontiers in Handwriting Recognition (ICFHR), Shenzhen, 2016.
Como citar:
Semaan, Gustavo Silva; Nascimento, Ênio de Oliveira; Henrique, Lubert; Corrêa, Débora Alvernaz; Brito, José André de Moura; "UM MÉTODO PARA CLASSIFICAÇÃO DE DADOS BASEADO NOS K-VIZINHOS MAIS PRÓXIMOS PARA O RECONHECIMENTO DE CARACTERES", p-2823-2834.
In: Anais do XIX Simpósio de Pesquisa Operacional & Logística da Marinha.
São Paulo: Blucher,
2020.
ISSN 21756295,
DOI 10.5151/spolm2019-204
últimos 30 dias
105
downloads
180
visualizações
758
indexações
Sou autor desse trabalho
Você é citado neste trabalho?
Exportar citação - RefWork (RIS)
Copie a citação abaixo ou clique no botão Download para obter um arquivo com os dados
TY - CONF T1 - UM MÉTODO PARA CLASSIFICAÇÃO DE DADOS BASEADO NOS K-VIZINHOS MAIS PRÓXIMOS PARA O RECONHECIMENTO DE CARACTERES JO - Simpósio de Pesquisa Operacional e Logística da Marinha - Publicação Online VL - 3 IS - 1 SP - 2823 EP - 2834 PY - 2020 T2 - XIX Simpósio de Pesquisa Operacional & Logística da Marinha AU - , , , , SN - 21756295 DO - http://dx.doi.org/10.5151/spolm2019-204 UR - www.proceedings.blucher.com.br/article-details/um-mtodo-para-classificao-de-dados-baseado-nos-k-vizinhos-mais-prximos-para-o-reconhecimento-de-caracteres-34619 KW - ER -
Exportar citação - BibTeX(BIB)
Copie a citação abaixo ou clique no botão Download para obter um arquivo com os dados
@article{Semaan20144,
title="UM MÉTODO PARA CLASSIFICAÇÃO DE DADOS BASEADO NOS K-VIZINHOS MAIS PRÓXIMOS PARA O RECONHECIMENTO DE CARACTERES",
journal="Simpósio de Pesquisa Operacional e Logística da Marinha - Publicação Online",
volume="3",
number="1",
pages="2823 - 2834",
year="2020",
note="",
issn="21756295",
doi="http://dx.doi.org/10.5151/spolm2019-204",
url="www.proceedings.blucher.com.br/article-details/um-mtodo-para-classificao-de-dados-baseado-nos-k-vizinhos-mais-prximos-para-o-reconhecimento-de-caracteres-34619",
author="Gustavo Silva Semaan", "Ênio de Oliveira Nascimento", "Lubert Henrique", "Débora Alvernaz Corrêa", "José André de Moura Brito",
keywords="",
}
Exportar citação - Text(TXT)
Copie a citação abaixo ou clique no botão Download para obter um arquivo com os dados
Gustavo Silva Semaan, Ênio de Oliveira Nascimento, Lubert Henrique, Débora Alvernaz Corrêa, José André de Moura Brito, UM MÉTODO PARA CLASSIFICAÇÃO DE DADOS BASEADO NOS K-VIZINHOS MAIS PRÓXIMOS PARA O RECONHECIMENTO DE CARACTERES, Simpósio de Pesquisa Operacional e Logística da Marinha - Publicação Online, Volume 3, 2020, Pages 2823-2834, ISSN 21756295, http://dx.doi.org/10.5151/spolm2019-204 (www.proceedings.blucher.com.br/article-details/um-mtodo-para-classificao-de-dados-baseado-nos-k-vizinhos-mais-prximos-para-o-reconhecimento-de-caracteres-34619) Palavras-chave:: ;