hoho Posted April 21, 2019 Report Posted April 21, 2019 Vajag izstrādāt programmu personāla atlases aģentūrai, kur viņi reģistrēs kandidātus un CV PDF un DOC formātos. Būs ap 10 000 cv. Vai varat ieteikt kā labāk organizēt CV glabāšanu un meklēšanu failos pēc atslēgas vārdiem? Es domāju glabāt CV failos , datubāzē linkus uz failiem, kad tiek pievienots CV, noparsēt saturu un saglabāt tekstu datubāzē. Un meklēt datubāzē, teksta laukā. Varbūt ir kāds pareizāks risinājums? Paldies! Quote
e-remit Posted April 22, 2019 Report Posted April 22, 2019 Meklēšanai vajag izmantot kādu text-search dzinēju, atbilstoši sagatavot datus. Liekas, meklēšanu gan pēc atslēgas vārdiem, gan pēc teksta, labi paveica tas pats Sphinx. Kā glabāt pašus failus - reliģijas jautājums. Galvenais, lai diskusija neaiziet šajā virzienā. Quote
briedis Posted April 22, 2019 Report Posted April 22, 2019 Sphinx diezgan oldschool, tagad sadzen dokumentus iekš Elasticsearch'a un meklē bez bēdām. Tas būtu vienkāršākais, grūtāk drīzāk būs nopārsēt CV, ņemot vērā, cik daudz dažādos, random formātos tas var būt, ja nav kaut kāds standartizēts. Es teiktu, ka automatizēt to būs nereāli. ...un 10k nav liela datubāze :) Quote
paleto pro Posted April 23, 2019 Report Posted April 23, 2019 On 4/22/2019 at 10:08 AM, briedis said: ...un 10k nav liela datubāze :) protams, draugiem.lv ir vairāk juzeri Quote
aaxc Posted April 23, 2019 Report Posted April 23, 2019 Tas nav saistīts ar draugiem. 10000 tiešām nav liela datubāze. Quote
ViltusVilks Posted May 13, 2019 Report Posted May 13, 2019 Ieteiktu Solr vai Elastic ar pdf/html indeksatoriem. Ja gribi tagot, tad vnk handlerus jāpielago (facet-iem). Priekš Solr/Elastic 10k dokumenti ir pile okeānā. Protams, ja viens CV nav +/- 1Gb datu, par ko šaubos. Quote
Recommended Posts
Join the conversation
You can post now and register later. If you have an account, sign in now to post with your account.