daGrevis Posted May 15, 2011 Report Share Posted May 15, 2011 Ir tāda ļoti noderīga lieta kā "Porter stemmer". Kas tas ir? Citēju... The Porter stemming algorithm (or ‘Porter stemmer’) is a process for removing the commoner morphological and inflexional endings from words in English. Its main use is as part of a term normalisation process that is usually done when setting up Information Retrieval systems. Citiem vārdiem sakot, tas ir skripts, kas vārdu, piemēram, "apples" pārveidos kā "apple". Šis algoritms ir noderīgs, piemēram, veidojot meklētājus lapai. Šeit algoritms ir pielāgots PHP valodai! Problēma... šis algoritms ir angļu valodai. Latviešu valodā gramatikas likumi ir daudz savādāki. Es teiktu, pat krāšņāki! Vai ir kāds guru, kas spētu to pielāgot arī latviešu valodai? Varbūt kas tāds jau ir gatavs! Kāds padalīsies? Quote Link to comment Share on other sites More sharing options...
rpr Posted May 16, 2011 Report Share Posted May 16, 2011 esam izmantojuši hunspell, lai no lv valodas dabūtu ārā vārdus nominatīvā. varbūt noder. Quote Link to comment Share on other sites More sharing options...
Lafriks Posted July 23, 2012 Report Share Posted July 23, 2012 Var mēģināt skatīties piemēru no šejienes: https://svn.apache.org/repos/asf/lucene/dev/trunk/lucene/analysis/common/src/java/org/apache/lucene/analysis/lv/ Ja vien nav kaut kāda specifiska vajadzība, tad es gan ieteiktu izmantot kaut kādu full-text meklēšnas engine Quote Link to comment Share on other sites More sharing options...
Recommended Posts
Join the conversation
You can post now and register later. If you have an account, sign in now to post with your account.