Dać rzeczy słowo

In Pchełki, Pchełki SQL, Pod prąd by xpil2 Comments

Kto po tytule niniejszego wpisu spodziewał się poezyj podchmurnych tudzież próz ambitnych, zawiedzie się srodze. Jam bowiem jest bazyl hartowany, nierdzewny, na cztery kwerendy kuty, a nie jakiś wierszoklet. Miast więc w cichości rymy pisać, zabawię się dziś słowem od strony statystyczno-obliczeniowej. W tym celu potrzebować będę składników następujących:

– baza danych słów języka polskiego, dostępna tutaj: http://www.sjp.pl/slownik/growy/ (na chwilę obecną około 2.7 mln słów)
– silnik bazy danych, na przykład MSSQL 2012, wersja testowa do ściągnięcia tutaj: http://www.microsoft.com/sqlserver/en/us/get-sql-server/try-it.aspx
– końputera, co by tę bazę udźwignął
– końceptu, co by mi podsuwał analizy jakoweś hecne a zacne.

Najsampierw należy zainstalować MSSQL-a, potem rozpakować plik ze słówkami i zapisać go gdzieś na lokalnym twardym dyskusie, na koniec wreszcie utworzyć nową, pustą bazę danych i zaimportować do niej te słówka. Pamiętajmy, że baza musi mieć polskie ustawienia porządku alfabetycznego (po naszemu „collation”), najlepiej Polish_CI_AS. Słówka importujemy krematorem, za pomocą SSIS. W ostatnim kroku zakładamy na kolumnę ze słówkami klucz unikalny, w samej Dahmerii kuty, niepowtarzalny i nie do podrobienia.

Jak się już uporamy z powyższymi zadaniami przedwstępnymi, mieć będziemy całkiem niebanalne narzędzie do rozmaitych zabaw ze słowami. U mnie baza nazywa się [slowa], tabela ze słówkami to [words] a jedyna kolumna w tejże tabeli to [slowo]. Tabela zawiera 2 775 805 słów – czyli wszystkie formy wszystkich słów języka polskiego dopuszczalnych w grach słownych. Przez „wszystkie formy” rozumiem nawet takie formy, które są poprawne z gramatycznego punktu widzenia, chociaż nigdy nie będą użyte poza planszą do gry – na przykład „czytałoś” albo „komiwojażery”.

Właściwa zabawa zaczyna się teraz.

Na początek spróbujmy znaleźć wszystkie unikalne końcówki trzyliterowe. A więc takie końcówki wyrazów dłuższych niż 3 litery, które w całym słowniku pojawiają się dokładnie jeden raz:

SELECT  RIGHT(slowo, 3)
FROM    words
WHERE   LEN(slowo) > 3
GROUP BY RIGHT(slowo, 3)
HAVING  COUNT(*) = 1

W efekcie otrzymujemy imponującą listę tysiąca stu szesnastu trzyliterowych kocówek:

abc, acr, aht, aiw, ajc, ajf, ajp, alf, ałż, anr, aor, aów, aqu, arr, asb, avę, axo, aze, ądl, ągr, ąto, baź, bdo, beć, bnu, bsu, bye, byl, ceb, cir, ciż, cok, coś, csa, cto, cuł, cun, cut, cuź, ddą, ddy, dew, dex, dęb, dhu, dic, did, dix, dow, dól, dta, dtę, duę, dui, duo, duy, dźa, dźą, dźb, dźę, dźi, dźo, eas, eff, ejd, ejf, ełb, ełp, ełż, emń, emz, enk, eos, epr, erś, esb, euk, ętl, ęzł, faż, fca, feż, fly, fru, fti, fum, fun, fuś, fut, gab, gag, gau, gby, ghę, gic, gil, giz, gst, gui, gża, gżo, hdo, hdy, hes, hęt, hic, hiz, hod, hoy, hub, hui, iąs, icr, ięz, ikk, imn, inn, ioć, irn, ish, jaś, jąż, jel, jgo, jje, jop, jpa, jpo, jrz, jsc, jub, jug, kąs, kęs, kfo, kfy, kha, khu, kuy, kyr, lax, lde, lęż, lir, lje, lod, loe, loo, lpe, łag, łgą, łmy, łót, łóz, łóź, łut, łwa, łwą, łwę, łzą, maa, mch, mix, mys, mza, mzą, nag, naw, nąż, ngh, ngw, njo, nle, nnu, nri, nug, ńba, ńbę, ńbo, ńby, oak, obs, odi, odł, oeą, oee, oho, oie, ojs, okt, olg, olm, oly, ońc, oor, orc, orl, orp, osł, oti, otn, otw, ova, ovą, oys, ódo, ójc, órg, ósi, óśb, ózi, óżd, pąg, pha, phą, pho, piż, pup, puś, pyż, qów, rdw, rgł, rir, rja, rję, rji, rjo, roh, roj, rox, rse, rui, sea, sew, sfa, siś, słę, syr, śco, śja, śją, śmo, tcz, teś, teź, thi, toć, toę, toy, tuy, ubn, uir, uld, ułk, umć, uti, utz, uus, uzd, uze, wex, wiw, wod, woo, wuń, yen, ygm, yha, yin, yiś, yit, yiż, ylp, ysp, yuj, ywr, zeź, zip, znu, zod, zow, zzz, źma, źmę, źńe, źńo, źom, żdę, żei, żew, żip, żły, żot, żuś, żwą, aar, ael, agd, ahr, aio, aiż, ajw, akf, alz, ałw, ańc, apń, asf, awk, axą, azb, azz, ąbą, bau, bąk, bbu, bdę, bec, bef, biw, boś, bti, bui, cab, ccą, ccz, chn, cit, cos, cre, cui, cwa, cwę, cwo, dap, daś, day, dąb, deb, dęk, dir, diż, dsu, dtu, dud, dyc, dyf, ebs, edm, eez, eio, eis, ejk, ekr, ełk, ełt, eły, erf, etn, eud, eyr, ębl, ętr, feb, fex, fic, fnu, fod, gfą, gfę, gho, ghu, gił, gży, hby, hca, hir, his, hja, hją, hji, hjo, hoę, iae, iau, icw, idi, ięc, ifą, ifę, ifi, igg, iin, iit, ijj, ikh, ioc, irs, isp, iwr, iya, iżb, jac, jaf, jgę, jja, jją, jol, jpę, jpy, jsą, jsę, juk, jut, kch, kib, kke, kyn, kyt, lbe, lci, lęg, liś, lox, lód, lys, lza, lzą, lzę, łęp, łgo, łmu, łnu, łob, łst, łsz, łwo, łys, łzo, łzy, mgą, mgi, moń, moż, mta, muk, muń, myz, myź, mzy, mża, mżą, mżo, neź, nęk, nke, nky, noą, nok, noo, noż, nót, nre, nuą, nuo, nuż, nys, nyż, oal, oap, oar, obz, ods, oeo, ogg, ogr, ohą, ohn, ohu, oia, oię, oji, okl, olń, olw, ołb, ołn, ołt, ołz, omr, omż, onk, oph, opr, orw, oth, ovo, ows, oyę, ódą, ódę, phę, piw, poł, poś, pse, rąk, rąp, rąś, reś, rhu, rif, rje, roy, ruc, ruf, ruh, rzg, sah, sey, sęk, shą, shę, skr, sył, śan, ścę, śji, tae, tah, tax, tby, teb, tiu, tof, tog, too, tou, tóg, tuo, tyg, tyż, tzy, uaż, ućm, udr, uel, ufe, ulb, ulk, ume, urń, uss, uth, uwi, uwn, wóg, wuś, wyc, wyś, yat, ycr, yer, ylw, ymf, ymn, yrw, ytw, yżm, yżw, zah, zbu, ziś, zoi, ztr, zyś, źan, źńę, źwu, żad, żdo, żła, żol, żua, żui, żyr, abz, act, adt, aed, aer, afn, ajś, ańć, apł, apt, aqa, atm, avo, awć, azw, ąbo, ątl, ążu, baż, bbi, bje, bói, bół, bub, bwe, cby, cez, chd, ciś, cul, cwą, cyf, dab, daw, ddę, ddo, deg, dij, dlo, doo, dóż, drń, duć, due, dźe, dźm, edn, edż, efl, eią, eie, eię, ekk, emn, emp, emr, eod, ets, eut, exi, eys, ezm, fei, fiń, fte, gdu, gej, gem, gha, ghą, gig, gri, gua, guo, guś, guy, gyn, hda, hdą, hdę, hdi, hez, hnu, hoa, hoą, hoj, hoo, htr, huć, hyr, hyż, iac, iaź, iąb, idl, ids, idw, ieb, igr, ike, ilg, ils, inf, irm, its, iug, iyn, jap, jąś, jęd, jję, jsk, jwu, kau, kez, kfę, ktr, kuę, lav, leh, lft, lja, lji, lky, lof, lth, luw, lwi, lzo, lzu, łab, łbu, łęg, łgę, łpu, łyć, łzę, łzn, mah, mbd, mgę, mme, mtą, myi, myo, mzo, mżę, mży, nac, nap, nbu, nef, nji, nkh, ntz, nuc, oan, oeę, oei, off, oge, oią, olb, ood, opf, opn, ośb, oud, ovę, oyą, ozd, ójł, óku, ółw, órć, óto, óżb, pah, pex, poc, poń, pył, que, ręz, rfi, rix, riz, rls, row, rói, rps, rrr, rue, rur, rzm, rżu, seo, siń, sir, skl, soś, sub, sug, szi, szw, sże, ścą, śje, śję, śma, śmą, śmę, tao, taź, też, tir, tiż, toa, toą, tuą, tuę, uad, ual, ubb, ucc, ugh, ujd, ukl, ulw, umm, unn, uor, uoz, urr, uzg, wci, web, wło, włu, wói, wre, wte, yjm, ylf, ylg, ynf, yot, ypr, yrr, ytr, yyz, ząp, zęz, zha, zog, zoj, zuh, zze, źlo, źlu, źńa, źńą, źńi, żci, żde, żeł, żob, żut, żwa, żwę, żwy, aab, aal, aćm, aen, afr, agg, amg, apn, aśm, atz, ava, avą, avy, axę, ażm, ąbę, bda, bdą, beg, błę, boa, bób, bsa, bst, ccę, cci, ccu, cew, cky, coc, cuz, cwy, cyś, dae, deś, dęg, dox, dtą, duą, dwu, dżm, eek, ees, egż, eiw, ekś, elw, ełą, ełe, ełę, ełm, eml, etł, ezd, ezw, eżn, ęsu, ęźb, fci, fcu, fig, gae, gci, gda, gec, ged, gfa, gfo, gfy, giś, gmi, guę, gyl, gżą, gże, gżę, hai, him, hje, hję, hut, hyń, ibe, idm, ife, igł, igw, ikw, ilt, ilz, inz, ird, itz, jąk, jed, jęż, jgą, jjo, jog, jok, jou, jpą, jso, juz, jwy, kaa, kfa, kfą, khy, kif, kku, kuą, kuo, laź, lęp, liu, lju, lmi, loc, loh, ltz, lwu, lye, lze, lzy, łwy, łyg, mae, mdź, mgo, moi, mpf, mzę, nae, naf, neb, nig, nju, noę, nro, nst, nth, nuę, nuń, nuy, nzu, ńbą, ńom, oad, oat, oaz, occ, oct, odm, oel, ofr, ohę, oio, oir, okk, oln, onf, opt, ovy, oyo, ozg, óda, óta, óźb, paq, peg, pęk, phy, pig, pop, ppe, ppi, puc, pum, puz, pyg, pyr, pyś, qom, ray, rąt, rbe, rig, ril, rip, rją, rłę, rme, rpt, ruw, scu, seń, sez, sfy, sho, skw, sui, śjo, tbe, tiv, tri, tuc, tże, uau, uef, uge, uhu, uji, uke, ulm, ulp, unc, uon, upn, urp, utw, użn, wąś, wąz, weś, węz, węż, wur, wuż, ydm, yge, yjś, ylń, yrd, yrp, yrs, yti, yuc, ywd, yzb, yzi, zag, ześ, zęb, zęs, zly, zóz, zup, zuz, źmą, źmo, żag, żai, żaz, żez, żmi, żum, żwo.

Tak, szanowni państwo, każda z powyższych kocówek należy do polskiego wyrazu. Konia z rzędem temu kto odgadnie chociażby 20% słów, kończących się jak wyżej.

W kolejnym kroku pokażę te słówka – po cholerę komu koń z rzędem. Zapytanie będzie całkiem podobne do poprzedniego, tylko trochę inne 😉

O, takie:

SELECT  slowo
FROM    words
WHERE   RIGHT(slowo, 3) IN ( SELECT RIGHT(slowo, 3)
                             FROM   words
                             WHERE  LEN(slowo) > 3
                             GROUP BY RIGHT(slowo, 3)
                             HAVING COUNT(*) = 1 )
        AND LEN(slowo) > 3;

 

W wyniku dostaniemy zgrabną listę tysiąca stu szesnastu słówek, które, dalibóg, przyprawiają co słabsze serca o drżenie:
abst, acajou, aćarja, aćarją, aćarje, aćarję, aćarji, aćarjo, adaś, aedicul, agem, agfa, agfą, agfę, agfo, agfy, aguti, ahmadij, ahmadijj, ahmadijja, ahmadijją, ahmadijje, ahmadijję, ahmadijjo, ahoj, aids, aidsu, akyn, alax, algonk, almawiw, aloe, ananke, androgyn, angst, ankh, antybakch, anyż, apagoge, appendix, armagnac, arui, ascez, asdic, askorbyl, astilbe, ausweis, autogolpe, autożyr, baht, bajęd, baklav, baklava, baklavą, baklavę, baklavo, baklavy, balboa, baldachim, banjo, baor, basf, basfa, basfy, batog, beglerbeg, belzebub, bełt, berbeć, bezoar, biologic, bistroph, bistropha, bistrophą, bistrophę, bistropho, bistrophy, biszkopt, blichtr, bluebird, bluetooth, bluzg, bodajś, bodeg, bombaż, borzoj, boutique, branle, bratrur, brawur, irokez, izonef, jabc, jabcok, jacobs, jacobsa, jacyś, jadźńa, jadźńą, jadźńe, jadźńę, jadźńi, jadźńo, jadźńom, jakowąś, jakoweś, jakowyś, jałmużn, jarzm, jaskr, jasyr, jazz, jersey, jesteś, jujub, juryskonsulci, jużci, jużciż, kabirpanth, kabz, kafei, kajut, kakaa, kakaów, kakau, kałmuk, kamikaze, kanap, kanji, kapoc, kapuc, kapuś, kapuz, kardyf, karibe, kasb, kashą, kashę, kasho, kasjop, kasże, katechez, kawci, kawć, kawuń, kawuś, kazb, każde, keczup, kenaf, kentucky, kerabau, kiełb, kiełzn, kiełznu, kiełż, kiepełą, kiepełe, kiepełę, kiepeły, kijaf, kilof, kilt, kitri, klechd, klechda, klechdą, klechdę, klechdo, klechdy, klefci, klęp, kloak, kloc, knag, knajp, knajpa, knajpą, knajpę, knajpo, knajpy, kneź, kniaź, koan, kobz, koel, kogg, koksagiz, kolb, koledż, kolosea, kołomyi, komż, komża, komżą, komżę, komżo, komży, koniin, konsjerżu, kopaiw, kopn, kopr, kośb, kraal, mikw, minialoh, minialohą, minialohę, minialoho, miodlo, miya, młót, młóta, młóto, modi, mods, mogił, mokk, molw, moly, mołodyc, monadnok, monokl, mordęg, mortir, morw, mozg, mórg, mrówkolwu, mrzeżn, mudr, mufte, mufti, muld, muppets, musztr, mutae, muwaszszah, mycorrhiz, mycorriz, myrr, nadaw, nadir, nadwątl, nakf, nakfa, nakfą, nakfę, nakfo, nakfy, narcyzi, nastoć, natomiastby, nazw, odpylń, odżelaź, oficjel, ofiklejd, ogdoad, oklapł, onąż, ongiś, onoż, onuc, oranżad, osęk, osłab, outdoor, ozoi, ożot, pacyf, paiż, pajac, pająk, pajok, pajsą, pajsę, pajso, pajuk, pańć, pardew, pardw, parr, paseo, paseos, pożądl, pójł, półbąk, pradżm, prakryti, prazjol, prażm, prestiż, prodiż, protopop, próchnu, próśb, przekąs, sibui, sikh, sikha, sikhu, sikhy, siorp, sirdab, sirocc, siroccu, skądciś, skądeś, skądsiś, skib, skidoo, skif, sztafaż, sztetł, sztof, sztolń, sztorc, sztuc, sztylp, szwenk, szwyc, szyfru, szypr, ścichapęk, świdw, świekr, świerzbu, tabbouleh, tacos, tael, tajęż, tajfun, tajgą, tajgę, tajgo, takyr, talmi, tamanduą, tamanduę, tamandui, tamanduo, tamanduy, tamg, tamgą, tamgę, tamgi, tamgo, tamta, tamtą, tartufe, taśm, taśma, taśmą, taśmę, taśmo, tatuaż, tayuc, technicsa, teff, tekke, temp, tenri, thai, tigr, tiurbe, tobół, tołpyg, tomahawk, tonf, toteż, toyot, trąbą, trąbę, trąbo, trefl, trip, trói, trójc, trwóg, trzeźwu, tsingtao, tsub, tsug, tuss, tussah, tyiyn, tymf, tynf, tyrp, tyrs, udżamaa, ugrzęzł, ugrzęźnijmyź, ultraproct, wytargł, wyżeł, wyżła, wyżły, yamah, yucc, yuccą, yuccę, yuppi, zachęt, zaćm, zaflegmi, zafr, zakomplekś, zakotw, zapętl, domr, dościgł, doyen, drajw, drajwu, drajwy, drozd, druh, druhu, dual, dubn, dubnu, duchn, dunst, durr, dwói, dylążu, dziegci, dziś, dziumdź, dziwło, dziwłu, dżag, dżaz, dżez, dżinn, dżip, dżum, eclipse, edta, edtą, edtę, efeb, efod, egri, eintopf, ekosez, ekscerpt, eliksir, enbu, epiloia, epiloią, epiloie, epiloię, epiloio, epizod, erhu, ersatz, eruw, erzherzog, eskaer, faen, fajf, fałsz, farfurń, fatyg, fecit, fejhoa, fejhoą, fejhoę, fejhoo, fejhoy, fellows, fengshui, fenig, fils, finf, firefly, firm, krąp, kreml, kroaz, kronprinz, kronprinzu, kryptogej, krzywd, krzyżm, księżmi, którąś, któreś, którzyś, kubb, kubbu, kulm, kulturkampf, kumć, kumys, kunżut, kupn, kurp, kuruc, kutw, kwagg, kweb, kwinoą, kwinoę, kwinoo, kyat, lacun, lambd, lambda, lambdą, lambdę, lambdo, lanug, larendogr, lądolód, leitmotiv, leiw, lekyt, lennu, lepr, lesb, lincoln, lisp, lituus, liwr, logaed, luau, lumpex, lutz, lycr, łosoś, łunochod, łyżew, łyżw, łyżwa, łyżwą, łyżwę, łyżwo, łyżwy, maalox, maar, maceb, macew, mafalde, mahajug, mahdi, mahr, makagig, małż, mamałyg, mambwe, mamuń, mandap, mangab, manitou, maracui, marathi, marchołt, masmix, matm, matrix, matronae, mayday, mąciwod, meches, mediae, megapyr, megil, mekk, menhir, meszuge, metax, metaxą, metaxę, metaxo, mezuz, mężuś, miau, miąs, micr, micw, micwa, micwą, micwę, micwo, micwy, midi, miejsc, miejscu, międzywęźlu, mięsu, mikrohut, mikropył, nielwi, niemr, nieuk, patiu, pawąz, pawęz, pawęż, pepeg, perfum, perłę, pesew, pewex, piegż, piegża, piegżą, piegże, piegżę, piegżo, piegży, pierś, pierzg, piętr, pigw, pinyin, pirs, pizze, plazmodezm, plebs, plebsu, pleciug, plymouth, płaskl, płóz, płóź, podsiń, pojędrń, pokląskw, przesył, przyboś, przyjm, przylg, przymiotn, przyszw, przywr, przyzb, pseud, psui, pulp, pułk, punc, pyrd, rabbi, raceboat, rachic, rachub, rallye, rapt, recto, redow, reggae, renju, renklod, repoussoir, rococ, skuą, skuę, skuo, skuy, słęp, słonaw, słońc, smerf, smerfuś, smileys, smirnoff, snigg, sojuz, solfeż, spah, spahis, spąg, spektr, spiż, spluw, spłyć, spójrz, spray, sprayuj, sprue, sprzężai, spyż, statuą, statuę, statuo, statuy, stealth, sterygm, steyr, stoa, stoą, stoę, stołb, stołbu, stołpu, stoo, stopiw, stoy, stóg, strąk, strąt, sucre, sulky, summ, sundae, sunn, sylf, sylw, szag, szajgec, szarif, szczeżui, szefic, szejk, szkafut, szlifą, szlifę, szlir, szmaragd, szmaragda, szmaragdu, wtranżol, wuef, wychędóż, wychłodł, wychyń, wyczha, wydęb, wydm, wydól, wylęg, wyrw, wyrwidąb, wysmukl, wysp, zwięz, zwięźlo, zwiotcz, zwischenruf, żanr, żłob, żołn, żonuń, żożob, żółw, żuwn, firn, fiume, fleut, fluidex, fluor, folg, fondue, fontaź, foyer, francuz, frawaszi, freikorps, frrr, fuji, funky, gaio, galeas, gamoń, gańdźa, gańdźą, gańdźe, gańdźę, gańdźi, gańdźo, gańdźom, garig, geek, gees, geez, genre, gentilhomme, genuą, genuę, genuo, genuy, geod, gędźb, giemz, giemza, giemzą, giemzę, giemzo, giemzy, gieroj, gilz, gilza, gilzą, gilzę, gilzo, gilzy, girls, gluon, gofr, goguś, goodbye, gospoś, goud, grafiń, gril, grizzly, gróźb, grzęz, guir, gułag, gymnospermae, gyyz, hafn, hafnu, hajc, hakenkreuze, half, hangyl, hanys, hańba, hańbą, hańbę, hańbo, hańby, haridźan, hathajog, hełm, hełmu, hełmy, highbrow, hobbits, hokku, holm, hoyą, hoyę, hoyo, hucuł, hufca, hufcu, hulk, hydrox, hymn, igloo, inro, interlingua, interlinguę, interlinguo, interlinguy, interlingw, interrexi, odezw, poliu, polja, polje, polji, polju, pontiac, pontifex, poroh, porohu, potańc, potorfi, unplugged, upup, urorrhoeą, urorrhoee, urorrhoeę, urorrhoei, urorrhoeo, urzeczow, uszebti, uszlachca, wajśja, wajśją, wajśje, wajśję, wajśji, wajśjo, wampum, wapn, wapń, watah, wągr, wcir, wedgwood, werteb, wewte, widm, wiedźm, wiedźma, wiedźmą, wiedźmę, wiedźmo, więc, więcby, więźb, wikijap, wilg, willys, wirtuoz, witeź, witz, włóku, włósi, wnęk, woal, wobec, wobłę, wojsk, woltyż, wołgą, wołgę, wołgo, wóda, wódą, wódę, wódo, wróżb, wróżd, wróżdę, wróżdo, wskrześ, bruzd, brzdęk, brzóz, brzytw, buddą, buddę, buddo, buddy, bujd, bulb, bulw, burżua, bzzz, cacci, candid, cardox, carioc, casanova, casanovą, casanovę, casanovo, casanovy, ceorl, cetn, chabaź, chałw, chałwa, chałwą, chałwę, chałwo, chałwy, chappe, charme, chełp, chełst, chintz, chintzy, chłopyś, chmyz, chomąto, chreią, chreie, chreię, chreio, chuć, chutbe, chyr, chyż, ciemn, ciemń, cioć, ciosłę, ciućm, ciżb, cnót, compact, compaq, compaqa, compaqom, compaqów, compaqu, config, cornish, córć, cuscut, cytopyge, cytr, czarcikęs, czepig, czeremch, czerymoi, czip, czółnu, czuh, czyha, czyiś, czyiż, czyjaś, czyjąś, czyjąż, czyjś, daewoo, daimyo, darmsztadt, darmsztadtu, darśan, dekokt, delft, demijohn, deseń, destrojs, destroy, dhoti, didżei, dikk, dławidud, dłut, docusoap, netsuke, ngui, nicpoń, nieb, niechby, niecoś, niedodm, niedołęg, nieduć, nife, nike, niktże, nilgau, noścą, noścę, nośco, noys, nózi, nurse, nurzybób, obiit, obje, obuwi, obydwu, rostbef, roślęż, rough, roughu, rozedm, rozglifi, rozkołys, rozwidl, ruad, rugby, rząp, rzemiosł, rzeź, rzępoł, rzęs, saab, sacr, sadhu, samobói, samojed, samoż, sangh, sangha, sanghą, sanghę, sangho, sankhja, sankhją, sankhje, sankhję, sankhji, sankhjo, scab, schmaltz, schmalz, schmalze, schmalzu, sedn, sejf, selw, semseyit, serir, sfrancuź, shoji, zarzuel, zawre, zazęb, zdeb, ześwieccz, zgag, zgiełk, zgręz, ziąb, ziębiw, ziębl, zimn, zineb, zliś, znowuż, znuż, zołz, zołzą, zołzę, zołzo, zołzy, zwiezd.

O, teraz się wzburzony Czytelnik wydrze na mnie z wielką pretensją, że co to niby za polszczyzna jest: nurse? destroy? obiit? Panie, toż to jakaś ściema jest, idźmy z tego durnego bloga i chodźmy poczytać jakieś fajne czasopisma opiniotwórcze! A tymczasem naga prawda jest taka, że te słówka są jak najbardziej polskie. Niedowiarków kieruję na http://sjp.pl

No dobra. Teraz coś całkiem innego – spróbujmy wyszukać wszystkie wyrazy, w których po literze ć lub ś pojawia się samogłoska. Zna ktoś takie? Mi przychodzi do głowy tylko „zadośćuczynić” oraz „ćakra” i „aćarja” (te dwa ostatnie znam bo gram na kurnik.pl a tam takie słówka to codzienność). Zobaczmy co w tej kwestii ma do powiedzenia nasz SQL-owy kuchcik Bartolini Bartłomiej:

SELECT  slowo
FROM    words
WHERE   slowo LIKE '%[ść][aeouiyęą]%';

Efekt: 135 słówek, z czego trzynaście form podstawowych: ćakra, ćapati, ćatni, ćela, ćwierćarkuszowy, darśana, zadośćuczynić, aćarja, śakti, śikhara, śilpaśastra, śiwaizm i śudra. Szczególnie do gustu przypadł mi wyraz śilpaśastra – tu zbitka ś+samogłoska występuje dwukrotnie. Ha.

Wkrótce planuję dorzucić jeszcze parę statystyk odnośnie częstotliwości występowania poszczególnych liter, odległości między literami i tak dalej. Wiedza kompletnie bezużyteczna, ale jakże piękna 😉

Tymczasem na zakończenie dziś kawał (niestety, tylko w języku Lengłidż – proszę sobie przetłumaczyć we własnym zakresie):

The tachyon leaves. The bartender says: „We don’t serve your kind here.” A tachyon walks into a bar.

Dodaj komentarz

2 komentarzy do "Dać rzeczy słowo"

Powiadom o
avatar
Sortuj wg:   najnowszy | najstarszy | oceniany
pendragon
Gość

Się nie wydrę tylko zastanowię się ponuro, czy to mój ojczysty język się tak rozwinął, czy to ja zostałem na emigracji w tyle i straciłem z nim kontakt bo nie wiem co znaczy polskie słowo "zwischenruf" albo takie np. "kronprinzu". Jak rzekłeś większości końcówek bym nie dopasował do członów, z pewną częścią całych wyrazów jakoś bym dał radę, ale cała lista na pierwszy rzut oka nie kojarzy się z polszczyzną. Z kwerend wychodzą niezłe czasem klocki. Dowcipu nie zrozumiałem, więc mój lengłidż też kuleje. Pora umierać.

wpDiscuz