domingo, 30 de março de 2008

Os tentáculos dos *spell Natura

É complicado saber até onde chega todo o tipo de recursos dicionarísticos do projecto Natura. Por vezes tenho de googlar para descobrir surpresas.

O projecto tem listas de palavras morfologicamente anotados, para o português (de Portugal), latim, espanhol, inglês, alguns estão divididos semanticamente. Outros possuem relações hierárquicas e todo o tipo de classificações que se acha útil para algum outro projecto. O objectivo do projecto não é propriamente distribuir dicionários para correcção ortográfica.

Alguns formatos do dicionário para correcção ortográfica e aplicações que os usam.
  • Jspell (1994) - Usado no analisador morfológico Jspell, e o WebJspell (via Lingua::Jspell (perl)). Isto é uma ferramenta desenvolvida na casa. (JJ e Ulisses).
  • Ispell - Usado pelo Ispell, VIM, Emacs.
  • Aspell - Usado pelo Ispell, VIM, Emacs, algumas aplicação de IM. Temos 3 versões (versão 0.5 (pt_PT), versão 0.5 (PT-BR), versão 0.6 (pt_PT).
  • Hunspell - Usado pelo Hunspell, e o analisador morfológico hunmorph, Openoffice 2.X, Firefox 3, Thunderbird 3... Falta mapear o conteúdo morfológico (jspell style) para o estilo do hunmorph.
  • Myspell - Usado por versões antigas dos programas anteriores.
Outros recursos são produzidos para além dos *spell, mas oportunamente posso referi-los. Se conhecerem outras aplicações, refiram nos comentários.

Em questão de licenças, está-se a tentar ultimamente que todos tenham as licenças GPL/LGPL/MPL. As ferramentas, e dicionários estão disponíveis no SVN.

Sem comentários: