Home > Class Reference > ENSLIB namespace > %Text.Portuguese
Private  Storage   

%Text.Portuguese


datatype class %Text.Portuguese extends %Text.Text

ODBC Type: VARCHAR

See %Text.Text

The %Text.Portuguese class implements the Portuguese language-specific stemming algorithm and initializes the language-specific list of noise words.

Inventory


Parameters Properties Methods Queries Indices ForeignKeys Triggers
5 4


Summary


Methods
AddDocToDictionary AddToDictionary AddToThesaurus BuildValueArray
ChooseSearchKey Classify CreateQList DecompressOffsets
DisplayToLogical DropDictionary EndOfWord ExcludeCommonTerms
IsValid JSONToLogical LoadThesaurus LogicalToDisplay
LogicalToJSON LogicalToOdbc LogicalToXSD MakeSearchTerms
Normalize RemoveDocFromDictionary RemoveFromThesaurus SeparateWords
Similarity SimilarityIdx Standardize Translate
XSDToLogical ends normFemininePortuguese removeAllAccents
removePTSuffix setto stemWord


Parameters


• parameter DICTIONARY = 7;
The default dictionary for properties of this class. By overriding the DICTIONARY you can create separate dictionaries for different kinds of properties in the same language. For example, email documents, legal briefs, and medical records might each have a separate dictionary so that term frequency and document similarity can be appropriately estimated in each separate domain.
• parameter NOISEWORDS100 = "de a e em é ele você isso ele era para em seja com como his eles seja em um tenha isto de ou teve por quente palavra mas que alguns nós lata para fora outro eram tudo lá quando acima use seu como dito cada ela qual seu tempo se vontade maneira sobre muitos então eles escreva como assim estes ela longo faça coisa veja ele dois tem olhar mais dia poderia vá vindo número som não maioria povos meu sobre saiba água do que chamada primeiramente quem possa para baixo lado sido agora achado alguns novo trabalho parte tomada";
NOISEWORDSnnn lists the most common words in the language, in order of their frequency of occurrence. See http://www.ranks.nl/stopwords/ for a list of commonly used noise words for many different languages.
• parameter NOISEWORDS200 = "comece lugar feito vivo onde seguida parte traseira pouco somente redondo homem ano veio mostra cada bom mim elasticidade nosso sob nome muito através apenas formulário sentença grande pense palavra ajuda baixo linha difira volta causa muito meio antes movimento direita menino velho demasiado mesmos diga jogo três queira ar poço também jogo pequeno extremidade posto home lido mão porto grande período adicione nivele terra aqui obrigação grande elevado tais siga ato porque peça homens mudança foi luz amável fora de necessidade casa retrato tentativa nós outra vez animal ponto mãe mundo perto configuração self terra pai cabeça carrinho para possuir página se país encontrado resposta";
• parameter NOISEWORDS300 = "escola cresça estudo ainda aprenda planta tampa alimento sol quatro entre estado sustento olho nunca último deixado pensamento cidade árvore cruz fazenda duramente começo poder história serra distante mar tração esquerdo tarde funcionamento não quando imprensa fim noite real vida poucos norte aberto pareça junto em seguida branco crianças comece começado caminhada exemplo facilidade papel grupo sempre música aqueles ambos marca frequentemente letra até milha rio carro pés cuidado em segundo livro carregue fêz exame ciência coma quarto amigo começou idéia peixes montanha batente uma vez que base ouça cavalo corte certo relógio cor cara madeira principal bastantes planície menina usual novo apronte acima sempre vermelho lista embora sensação";
• parameter SOURCELANGUAGE = "pt";
SOURCELANGUAGEUAGE specifies the default source language to translate documents or queries from. This enables documents written and stored in multiple langauges to be queried in a single common language.

Methods


• classmethod normFemininePortuguese(ByRef b As %String, ByRef k As %Integer, ByRef j As %Integer)
• classmethod removeAllAccents(ByRef b As %String, ByRef k As %Integer)
• classmethod removePTSuffix(ByRef b As %String, ByRef k As %Integer, ByRef j As %Integer)
Remove plural and feminine form of Portuguese words
• classmethod stemWord(ByRef b As %String) as %String
Simple Portuguese stemmer. See http://www.unine.ch/info/clef/portugueseStemmer.txt