Título
[en] LUAGRAPHEME: A LUA LIBRARY FOR UNICODE TEXT SEGMENTATION
Título
[pt] LUAGRAPHEME: UMA BIBLIOTECA LUA PARA SEGMENTAÇÃO DE TEXTO UNICODE
Autor
[pt] GABRIEL VIANNA SOLDANI
Vocabulário
[pt] LINGUAGEM DE PROGRAMACAO LUA
Vocabulário
[pt] CASE FOLDING
Vocabulário
[pt] GRAPHEME CLUSTER
Vocabulário
[pt] UNICODE
Vocabulário
[pt] LPEG
Vocabulário
[pt] GRAMATICA DE ANALISE SINTATICA DE EXPRESSAO
Vocabulário
[en] LUA PROGRAMMING LANGUAGE
Vocabulário
[en] CASE FOLDING
Vocabulário
[en] GRAPHEME CLUSTER
Vocabulário
[en] UNICODE
Vocabulário
[en] LPEG
Vocabulário
[en] PARSING EXPRESSION GRAMMAR
Resumo
[pt] luagrapheme é uma biblioteca para segmentação de textos Unicode na
linguagem Lua. Seu objetivo é identificar com precisão unidades textuais
como grapheme clusters (caracteres visuais percebidos pelos usuários),
palavras, frases e oportunidades de quebras de linha. O projeto consiste em
bindings para a libgrapheme, biblioteca minimalista em C que implementa
fielmente os algoritmos definidos pelo padrão Unicode. O luagrapheme
oferece integrações com a biblioteca LPeg, permitindo a escrita e
reconhecimento de padrões e gramáticas baseadas em Parsing Expression
Grammars (PEGs) que incorporam os algoritmos de segmentação do
Unicode. A metodologia combinou desenvolvimento em Lua e C, com testes
automatizados e integração contínua. O resultado é uma biblioteca
pequena, previsível e portátil, que amplia o suporte Unicode no ecossistema
Lua e torna o processamento de texto multilíngue mais acessível a
desenvolvedores.
Resumo
[en] luagrapheme is a library for Unicode text segmentation in the Lua
programming language. Its goal is to accurately identify textual units such as
grapheme clusters (the visual characters perceived by users), words,
sentences, and line break opportunities. The project consists of bindings for
libgrapheme, a minimalist C library that faithfully implements the algorithms
defined by the Unicode Standard. luagrapheme provides integration with the
LPeg library, enabling the definition and recognition of patterns and
grammars based on Parsing Expression Grammars (PEGs) that incorporate
Unicode segmentation algorithms. The methodology combined development
in Lua and C, supported by automated testing and continuous integration.
The result is a small, predictable, and portable library that enhances Unicode
support in the Lua ecosystem and makes multilingual text processing more
accessible to developers.
Orientador(es)
ROBERTO IERUSALIMSCHY
Orientador(es)
LUIS FERNANDO TEIXEIRA BICALHO
Catalogação
2026-03-25
Tipo
[pt] TEXTO
Formato
application/pdf
Idioma(s)
PORTUGUÊS
Referência [pt]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=75806@1
Referência [en]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=75806@2
Arquivos do conteúdo
NA ÍNTEGRA PDF