Maxwell Para Simples Indexação

Título
[en] LUAGRAPHEME: A LUA LIBRARY FOR UNICODE TEXT SEGMENTATION

Título
[pt] LUAGRAPHEME: UMA BIBLIOTECA LUA PARA SEGMENTAÇÃO DE TEXTO UNICODE

Autor
[pt] GABRIEL VIANNA SOLDANI

Vocabulário
[pt] LINGUAGEM DE PROGRAMACAO LUA

Vocabulário
[pt] CASE FOLDING

Vocabulário
[pt] GRAPHEME CLUSTER

Vocabulário
[pt] UNICODE

Vocabulário
[pt] LPEG

Vocabulário
[pt] GRAMATICA DE ANALISE SINTATICA DE EXPRESSAO

Vocabulário
[en] LUA PROGRAMMING LANGUAGE

Vocabulário
[en] CASE FOLDING

Vocabulário
[en] GRAPHEME CLUSTER

Vocabulário
[en] UNICODE

Vocabulário
[en] LPEG

Vocabulário
[en] PARSING EXPRESSION GRAMMAR

Resumo
[pt] luagrapheme é uma biblioteca para segmentação de textos Unicode na linguagem Lua. Seu objetivo é identificar com precisão unidades textuais como grapheme clusters (caracteres visuais percebidos pelos usuários), palavras, frases e oportunidades de quebras de linha. O projeto consiste em bindings para a libgrapheme, biblioteca minimalista em C que implementa fielmente os algoritmos definidos pelo padrão Unicode. O luagrapheme oferece integrações com a biblioteca LPeg, permitindo a escrita e reconhecimento de padrões e gramáticas baseadas em Parsing Expression Grammars (PEGs) que incorporam os algoritmos de segmentação do Unicode. A metodologia combinou desenvolvimento em Lua e C, com testes automatizados e integração contínua. O resultado é uma biblioteca pequena, previsível e portátil, que amplia o suporte Unicode no ecossistema Lua e torna o processamento de texto multilíngue mais acessível a desenvolvedores.

Resumo
[en] luagrapheme is a library for Unicode text segmentation in the Lua programming language. Its goal is to accurately identify textual units such as grapheme clusters (the visual characters perceived by users), words, sentences, and line break opportunities. The project consists of bindings for libgrapheme, a minimalist C library that faithfully implements the algorithms defined by the Unicode Standard. luagrapheme provides integration with the LPeg library, enabling the definition and recognition of patterns and grammars based on Parsing Expression Grammars (PEGs) that incorporate Unicode segmentation algorithms. The methodology combined development in Lua and C, supported by automated testing and continuous integration. The result is a small, predictable, and portable library that enhances Unicode support in the Lua ecosystem and makes multilingual text processing more accessible to developers.

Orientador(es)
ROBERTO IERUSALIMSCHY

Orientador(es)
LUIS FERNANDO TEIXEIRA BICALHO

Catalogação
2026-03-25

Tipo
[pt] TEXTO

Formato
application/pdf

Idioma(s)
PORTUGUÊS

Referência [pt]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=75806@1

Referência [en]
https://www.maxwell.vrac.puc-rio.br/colecao.php?strSecao=resultado&nrSeq=75806@2


Arquivos do conteúdo
NA ÍNTEGRA PDF