13 Haziran 2017 Salı

13.500 Sernavên nû yên Îngîlîzî bo Wîkîferhengê



Lihevanîna peyvan hewce bû
Di Wîkîferhengê de berê mehneya nêzî 63.000 peyv û biwêjên Îngîlîzî hebû. Lê helbet kêm û kêmasî tê de pirr bûn. Min berê jî bi xêra Cyrusbotê û programên kompîtûrê, ferhenga Salah Sadallah'a ku li ser înternetê peyda dibe, têxistibû Wîkîferhengê. Lê ew bi skankirinê(sacan) hatibû veguherandin doseyaya elektronîk. Loma tê de gelek şaşiyên herfan û kodkirina tîpan hebû. Wek mînak, di gelek cihan de "S" wek "5" hatibû veguharandin, I an jî "l" wek "1" hatibû veguharandin, "O" û "D"'yê bi şaşî şûna hev girtibû, "T" ketibû şûna "Y" û hwd. Ango, bi skankirinê re, bi veguherandinê re gelek şaşî çêbûbûn. Li hindê van şaşiyan bi veguharandina wê ya cara berî vê ya ji hêla min re jî di lihevanîna peyvan de hin şaşî çêbûbûn. Mîna gelek ferhengan, di ferhenga Salah Sadallah de jî peyv û biwêjên pirrpeyvên ku tê de peyvên tekrar dibin dîsa nehatibûn nivîsandin, lêbelê wek "-"'yê hatibûn temsîl kirin. Wekî ku li resmê kêlekê tê dît, wek mînak, di bin peyva "Absolut" de hemû peyvên ji "Absolut"ê çêdibin(Absolut density, absolut humidity, absolute zero û hwd.) hatibûn rêz kirin. Lê di dema lihevanîna wan a bi bernameya kompîtûrê re, bi pirranî ji ber şaşiyên skankirinê, jî şaşî çêbûbûn.

Lîsteya peyvên Îngîlîzî ~4 mîlonan
Loma min carekî din dest bi kar kir. Berî her tiştî min algorîtmaya lihevanîna peyvan baştir kir. Min bi rêya bernameya kompîtûrê, bi algorîtmayeke tîpên destpêka peyvan didan ber hev, min peyv li hev dianîn û tîpên şaş sererast dikirin. Lê helbet bo referansgirtinê çavkaniyek hewce bû. Min ew jî bi daxistina lîsteya peyv û biwêjên Îngîlîzî yên li ser înternetê peyda dibin çareser kir. Bi komkirina lîsteyên wihanî bi tevayî lîsteyeka nêzî 4 mîlyonanan li ber destên min hazir bû. Werhasil, bi sererastkirineka rasttir û baştir re, lîsteyeka mezin, lîsteyeka nêzî 10 hezar peyv û biwêjên  Îngîlîzî yên ku bên têxistin Wîkîferhengê bi dest ketin. Lê belê hîn jî tê de hin peyv û (bi pirranî) biwêjên ku meriv dikare jê derxîne, lêbelê di lîsteya Îngîlîzî ya di dest min de nayên dîtin hebûn. Ew bi pirranî biwêj bûn û min ew peyvan li lîsteyeka din qeyd kirin. Paşê min peyvên di wê lîsteyê de yekeyek bixwe kontrol kirin, hema bêje min ew hemû yekeyek kopya kirin, li ser Google'êl lê gerriyam. Peyv û biwêjên ku min piştrast kirin di lîsteyê de hîştin û yên şaş bûn û nedihatin peyda kirin jî min ji lîsteyê avitin. Bi vî şiklî jî nêzî 2.500 peyv û biwêjên giranbiha bi dest ketin. Ji ber ku ew biwêjan di ferhengan de zêde nedihatin dîtin, ew giranbiha bûn. Dawiya dawîn peyvên bên têxistin Wîkîferhengê gihîştin 13.500'an. Êdî li vê şûnde kar karê Cyrusbot'ê bû. Jixwe bila hema li ber destên Cyrusbotê lîsteyeka têxistinê hebûya, wî berê nêzî 300.000 peyv li ser Wîkîferhengê çêkiribûn. Ew dikarî bi şev û rojan bixebita û peyv û biwêjên nûa pêşkêşî Wîkîferhengê û bikarhênerên Wîkîferhengê bikirana. Lê de were vê ecêbê ku niha Wîkîferheng li Tirkiyê qedexe bû. Lê şukir ku ji dû çend ceribandinan re, Cyrusbotê ji xwe re rêyek didît û peyv dixistina Wîkîferhengê. Werhasil, ew 13.500 peyv û biwêjan hatin têxistin Wîkîferhengê û hejmera sernavên di Wîkîferhengê de gihîştin 515.000'an.
Lîsteya ku min yekeyek bi destan kontrol kir

Cyrsubot karê xwe dike