| Título: | LUAGRAPHEME: UMA BIBLIOTECA LUA PARA SEGMENTAÇÃO DE TEXTO UNICODE | ||||||||||||
| Autor(es): |
GABRIEL VIANNA SOLDANI |
||||||||||||
| Colaborador(es): |
ROBERTO IERUSALIMSCHY - Orientador LUIS FERNANDO TEIXEIRA BICALHO - Orientador |
||||||||||||
| Catalogação: | 25/MAR/2026 | Língua(s): | PORTUGUÊS - BRASIL |
||||||||||
| Tipo: | TEXTO | Subtipo: | TRABALHO DE FIM DE CURSO | ||||||||||
| Notas: |
[pt] Todos os dados constantes dos documentos são de inteira responsabilidade de seus autores. Os dados utilizados nas descrições dos documentos estão em conformidade com os sistemas da administração da PUC-Rio. [en] All data contained in the documents are the sole responsibility of the authors. The data used in the descriptions of the documents are in conformity with the systems of the administration of PUC-Rio. |
||||||||||||
| Referência(s): |
[pt] https://www.maxwell.vrac.puc-rio.br/projetosEspeciais/TFCs/consultas/conteudo.php?strSecao=resultado&nrSeq=75806@1 [en] https://www.maxwell.vrac.puc-rio.br/projetosEspeciais/TFCs/consultas/conteudo.php?strSecao=resultado&nrSeq=75806@2 |
||||||||||||
| DOI: | https://doi.org/10.17771/PUCRio.acad.75806 | ||||||||||||
| Resumo: | |||||||||||||
|
luagrapheme é uma biblioteca para segmentação de textos Unicode na
linguagem Lua. Seu objetivo é identificar com precisão unidades textuais
como grapheme clusters (caracteres visuais percebidos pelos usuários),
palavras, frases e oportunidades de quebras de linha. O projeto consiste em
bindings para a libgrapheme, biblioteca minimalista em C que implementa
fielmente os algoritmos definidos pelo padrão Unicode. O luagrapheme
oferece integrações com a biblioteca LPeg, permitindo a escrita e
reconhecimento de padrões e gramáticas baseadas em Parsing Expression
Grammars (PEGs) que incorporam os algoritmos de segmentação do
Unicode. A metodologia combinou desenvolvimento em Lua e C, com testes
automatizados e integração contínua. O resultado é uma biblioteca
pequena, previsível e portátil, que amplia o suporte Unicode no ecossistema
Lua e torna o processamento de texto multilíngue mais acessível a
desenvolvedores.
|
|||||||||||||
|
|||||||||||||