Dać rzeczy słowo

Kto po tytule niniejszego wpisu spodziewał się poezyj podchmurnych tudzież próz ambitnych, zawiedzie się srodze. Jam bowiem jest bazyl hartowany, nierdzewny, na cztery kwerendy kuty, a nie jakiś wierszoklet. Miast więc w cichości rymy pisać, zabawię się dziś słowem od strony statystyczno-obliczeniowej. W tym celu potrzebować będę składników następujących:

– baza danych słów języka polskiego, dostępna tutaj: http://www.sjp.pl/slownik/growy/ (na chwilę obecną około 2.7 mln słów)
– silnik bazy danych, na przykład MSSQL 2012, wersja testowa do ściągnięcia tutaj: http://www.microsoft.com/sqlserver/en/us/get-sql-server/try-it.aspx
– końputera, co by tę bazę udźwignął
– końceptu, co by mi podsuwał analizy jakoweś hecne a zacne.

Najsampierw należy zainstalować MSSQL-a, potem rozpakować plik ze słówkami i zapisać go gdzieś na lokalnym twardym dyskusie, na koniec wreszcie utworzyć nową, pustą bazę danych i zaimportować do niej te słówka. Pamiętajmy, że baza musi mieć polskie ustawienia porządku alfabetycznego (po naszemu „collation”), najlepiej Polish_CI_AS. Słówka importujemy krematorem, za pomocą SSIS. W ostatnim kroku zakładamy na kolumnę ze słówkami klucz unikalny, w samej Dahmerii kuty, niepowtarzalny i nie do podrobienia.

Jak się już uporamy z powyższymi zadaniami przedwstępnymi, mieć będziemy całkiem niebanalne narzędzie do rozmaitych zabaw ze słowami. U mnie baza nazywa się [slowa], tabela ze słówkami to [words] a jedyna kolumna w tejże tabeli to [slowo]. Tabela zawiera 2 775 805 słów – czyli wszystkie formy wszystkich słów języka polskiego dopuszczalnych w grach słownych. Przez „wszystkie formy” rozumiem nawet takie formy, które są poprawne z gramatycznego punktu widzenia, chociaż nigdy nie będą użyte poza planszą do gry – na przykład „czytałoś” albo „komiwojażery”.

Właściwa zabawa zaczyna się teraz.

Na początek spróbujmy znaleźć wszystkie unikalne końcówki trzyliterowe. A więc takie końcówki wyrazów dłuższych niż 3 litery, które w całym słowniku pojawiają się dokładnie jeden raz:

SELECT  RIGHT(slowo, 3)
FROM    words
WHERE   LEN(slowo) > 3
GROUP BY RIGHT(slowo, 3)
HAVING  COUNT(*) = 1

W efekcie otrzymujemy imponującą listę tysiąca stu szesnastu trzyliterowych kocówek:

abc, acr, aht, aiw, ajc, ajf, ajp, alf, ałż, anr, aor, aów, aqu, arr, asb, avę, axo, aze, ądl, ągr, ąto, baź, bdo, beć, bnu, bsu, bye, byl, ceb, cir, ciż, cok, coś, csa, cto, cuł, cun, cut, cuź, ddą, ddy, dew, dex, dęb, dhu, dic, did, dix, dow, dól, dta, dtę, duę, dui, duo, duy, dźa, dźą, dźb, dźę, dźi, dźo, eas, eff, ejd, ejf, ełb, ełp, ełż, emń, emz, enk, eos, epr, erś, esb, euk, ętl, ęzł, faż, fca, feż, fly, fru, fti, fum, fun, fuś, fut, gab, gag, gau, gby, ghę, gic, gil, giz, gst, gui, gża, gżo, hdo, hdy, hes, hęt, hic, hiz, hod, hoy, hub, hui, iąs, icr, ięz, ikk, imn, inn, ioć, irn, ish, jaś, jąż, jel, jgo, jje, jop, jpa, jpo, jrz, jsc, jub, jug, kąs, kęs, kfo, kfy, kha, khu, kuy, kyr, lax, lde, lęż, lir, lje, lod, loe, loo, lpe, łag, łgą, łmy, łót, łóz, łóź, łut, łwa, łwą, łwę, łzą, maa, mch, mix, mys, mza, mzą, nag, naw, nąż, ngh, ngw, njo, nle, nnu, nri, nug, ńba, ńbę, ńbo, ńby, oak, obs, odi, odł, oeą, oee, oho, oie, ojs, okt, olg, olm, oly, ońc, oor, orc, orl, orp, osł, oti, otn, otw, ova, ovą, oys, ódo, ójc, órg, ósi, óśb, ózi, óżd, pąg, pha, phą, pho, piż, pup, puś, pyż, qów, rdw, rgł, rir, rja, rję, rji, rjo, roh, roj, rox, rse, rui, sea, sew, sfa, siś, słę, syr, śco, śja, śją, śmo, tcz, teś, teź, thi, toć, toę, toy, tuy, ubn, uir, uld, ułk, umć, uti, utz, uus, uzd, uze, wex, wiw, wod, woo, wuń, yen, ygm, yha, yin, yiś, yit, yiż, ylp, ysp, yuj, ywr, zeź, zip, znu, zod, zow, zzz, źma, źmę, źńe, źńo, źom, żdę, żei, żew, żip, żły, żot, żuś, żwą, aar, ael, agd, ahr, aio, aiż, ajw, akf, alz, ałw, ańc, apń, asf, awk, axą, azb, azz, ąbą, bau, bąk, bbu, bdę, bec, bef, biw, boś, bti, bui, cab, ccą, ccz, chn, cit, cos, cre, cui, cwa, cwę, cwo, dap, daś, day, dąb, deb, dęk, dir, diż, dsu, dtu, dud, dyc, dyf, ebs, edm, eez, eio, eis, ejk, ekr, ełk, ełt, eły, erf, etn, eud, eyr, ębl, ętr, feb, fex, fic, fnu, fod, gfą, gfę, gho, ghu, gił, gży, hby, hca, hir, his, hja, hją, hji, hjo, hoę, iae, iau, icw, idi, ięc, ifą, ifę, ifi, igg, iin, iit, ijj, ikh, ioc, irs, isp, iwr, iya, iżb, jac, jaf, jgę, jja, jją, jol, jpę, jpy, jsą, jsę, juk, jut, kch, kib, kke, kyn, kyt, lbe, lci, lęg, liś, lox, lód, lys, lza, lzą, lzę, łęp, łgo, łmu, łnu, łob, łst, łsz, łwo, łys, łzo, łzy, mgą, mgi, moń, moż, mta, muk, muń, myz, myź, mzy, mża, mżą, mżo, neź, nęk, nke, nky, noą, nok, noo, noż, nót, nre, nuą, nuo, nuż, nys, nyż, oal, oap, oar, obz, ods, oeo, ogg, ogr, ohą, ohn, ohu, oia, oię, oji, okl, olń, olw, ołb, ołn, ołt, ołz, omr, omż, onk, oph, opr, orw, oth, ovo, ows, oyę, ódą, ódę, phę, piw, poł, poś, pse, rąk, rąp, rąś, reś, rhu, rif, rje, roy, ruc, ruf, ruh, rzg, sah, sey, sęk, shą, shę, skr, sył, śan, ścę, śji, tae, tah, tax, tby, teb, tiu, tof, tog, too, tou, tóg, tuo, tyg, tyż, tzy, uaż, ućm, udr, uel, ufe, ulb, ulk, ume, urń, uss, uth, uwi, uwn, wóg, wuś, wyc, wyś, yat, ycr, yer, ylw, ymf, ymn, yrw, ytw, yżm, yżw, zah, zbu, ziś, zoi, ztr, zyś, źan, źńę, źwu, żad, żdo, żła, żol, żua, żui, żyr, abz, act, adt, aed, aer, afn, ajś, ańć, apł, apt, aqa, atm, avo, awć, azw, ąbo, ątl, ążu, baż, bbi, bje, bói, bół, bub, bwe, cby, cez, chd, ciś, cul, cwą, cyf, dab, daw, ddę, ddo, deg, dij, dlo, doo, dóż, drń, duć, due, dźe, dźm, edn, edż, efl, eią, eie, eię, ekk, emn, emp, emr, eod, ets, eut, exi, eys, ezm, fei, fiń, fte, gdu, gej, gem, gha, ghą, gig, gri, gua, guo, guś, guy, gyn, hda, hdą, hdę, hdi, hez, hnu, hoa, hoą, hoj, hoo, htr, huć, hyr, hyż, iac, iaź, iąb, idl, ids, idw, ieb, igr, ike, ilg, ils, inf, irm, its, iug, iyn, jap, jąś, jęd, jję, jsk, jwu, kau, kez, kfę, ktr, kuę, lav, leh, lft, lja, lji, lky, lof, lth, luw, lwi, lzo, lzu, łab, łbu, łęg, łgę, łpu, łyć, łzę, łzn, mah, mbd, mgę, mme, mtą, myi, myo, mzo, mżę, mży, nac, nap, nbu, nef, nji, nkh, ntz, nuc, oan, oeę, oei, off, oge, oią, olb, ood, opf, opn, ośb, oud, ovę, oyą, ozd, ójł, óku, ółw, órć, óto, óżb, pah, pex, poc, poń, pył, que, ręz, rfi, rix, riz, rls, row, rói, rps, rrr, rue, rur, rzm, rżu, seo, siń, sir, skl, soś, sub, sug, szi, szw, sże, ścą, śje, śję, śma, śmą, śmę, tao, taź, też, tir, tiż, toa, toą, tuą, tuę, uad, ual, ubb, ucc, ugh, ujd, ukl, ulw, umm, unn, uor, uoz, urr, uzg, wci, web, wło, włu, wói, wre, wte, yjm, ylf, ylg, ynf, yot, ypr, yrr, ytr, yyz, ząp, zęz, zha, zog, zoj, zuh, zze, źlo, źlu, źńa, źńą, źńi, żci, żde, żeł, żob, żut, żwa, żwę, żwy, aab, aal, aćm, aen, afr, agg, amg, apn, aśm, atz, ava, avą, avy, axę, ażm, ąbę, bda, bdą, beg, błę, boa, bób, bsa, bst, ccę, cci, ccu, cew, cky, coc, cuz, cwy, cyś, dae, deś, dęg, dox, dtą, duą, dwu, dżm, eek, ees, egż, eiw, ekś, elw, ełą, ełe, ełę, ełm, eml, etł, ezd, ezw, eżn, ęsu, ęźb, fci, fcu, fig, gae, gci, gda, gec, ged, gfa, gfo, gfy, giś, gmi, guę, gyl, gżą, gże, gżę, hai, him, hje, hję, hut, hyń, ibe, idm, ife, igł, igw, ikw, ilt, ilz, inz, ird, itz, jąk, jed, jęż, jgą, jjo, jog, jok, jou, jpą, jso, juz, jwy, kaa, kfa, kfą, khy, kif, kku, kuą, kuo, laź, lęp, liu, lju, lmi, loc, loh, ltz, lwu, lye, lze, lzy, łwy, łyg, mae, mdź, mgo, moi, mpf, mzę, nae, naf, neb, nig, nju, noę, nro, nst, nth, nuę, nuń, nuy, nzu, ńbą, ńom, oad, oat, oaz, occ, oct, odm, oel, ofr, ohę, oio, oir, okk, oln, onf, opt, ovy, oyo, ozg, óda, óta, óźb, paq, peg, pęk, phy, pig, pop, ppe, ppi, puc, pum, puz, pyg, pyr, pyś, qom, ray, rąt, rbe, rig, ril, rip, rją, rłę, rme, rpt, ruw, scu, seń, sez, sfy, sho, skw, sui, śjo, tbe, tiv, tri, tuc, tże, uau, uef, uge, uhu, uji, uke, ulm, ulp, unc, uon, upn, urp, utw, użn, wąś, wąz, weś, węz, węż, wur, wuż, ydm, yge, yjś, ylń, yrd, yrp, yrs, yti, yuc, ywd, yzb, yzi, zag, ześ, zęb, zęs, zly, zóz, zup, zuz, źmą, źmo, żag, żai, żaz, żez, żmi, żum, żwo.

Tak, szanowni państwo, każda z powyższych kocówek należy do polskiego wyrazu. Konia z rzędem temu kto odgadnie chociażby 20% słów, kończących się jak wyżej.

W kolejnym kroku pokażę te słówka – po cholerę komu koń z rzędem. Zapytanie będzie całkiem podobne do poprzedniego, tylko trochę inne 😉

O, takie:

SELECT  slowo
FROM    words
WHERE   RIGHT(slowo, 3) IN ( SELECT RIGHT(slowo, 3)
                             FROM   words
                             WHERE  LEN(slowo) > 3
                             GROUP BY RIGHT(slowo, 3)
                             HAVING COUNT(*) = 1 )
        AND LEN(slowo) > 3;

 

W wyniku dostaniemy zgrabną listę tysiąca stu szesnastu słówek, które, dalibóg, przyprawiają co słabsze serca o drżenie:
abst, acajou, aćarja, aćarją, aćarje, aćarję, aćarji, aćarjo, adaś, aedicul, agem, agfa, agfą, agfę, agfo, agfy, aguti, ahmadij, ahmadijj, ahmadijja, ahmadijją, ahmadijje, ahmadijję, ahmadijjo, ahoj, aids, aidsu, akyn, alax, algonk, almawiw, aloe, ananke, androgyn, angst, ankh, antybakch, anyż, apagoge, appendix, armagnac, arui, ascez, asdic, askorbyl, astilbe, ausweis, autogolpe, autożyr, baht, bajęd, baklav, baklava, baklavą, baklavę, baklavo, baklavy, balboa, baldachim, banjo, baor, basf, basfa, basfy, batog, beglerbeg, belzebub, bełt, berbeć, bezoar, biologic, bistroph, bistropha, bistrophą, bistrophę, bistropho, bistrophy, biszkopt, blichtr, bluebird, bluetooth, bluzg, bodajś, bodeg, bombaż, borzoj, boutique, branle, bratrur, brawur, irokez, izonef, jabc, jabcok, jacobs, jacobsa, jacyś, jadźńa, jadźńą, jadźńe, jadźńę, jadźńi, jadźńo, jadźńom, jakowąś, jakoweś, jakowyś, jałmużn, jarzm, jaskr, jasyr, jazz, jersey, jesteś, jujub, juryskonsulci, jużci, jużciż, kabirpanth, kabz, kafei, kajut, kakaa, kakaów, kakau, kałmuk, kamikaze, kanap, kanji, kapoc, kapuc, kapuś, kapuz, kardyf, karibe, kasb, kashą, kashę, kasho, kasjop, kasże, katechez, kawci, kawć, kawuń, kawuś, kazb, każde, keczup, kenaf, kentucky, kerabau, kiełb, kiełzn, kiełznu, kiełż, kiepełą, kiepełe, kiepełę, kiepeły, kijaf, kilof, kilt, kitri, klechd, klechda, klechdą, klechdę, klechdo, klechdy, klefci, klęp, kloak, kloc, knag, knajp, knajpa, knajpą, knajpę, knajpo, knajpy, kneź, kniaź, koan, kobz, koel, kogg, koksagiz, kolb, koledż, kolosea, kołomyi, komż, komża, komżą, komżę, komżo, komży, koniin, konsjerżu, kopaiw, kopn, kopr, kośb, kraal, mikw, minialoh, minialohą, minialohę, minialoho, miodlo, miya, młót, młóta, młóto, modi, mods, mogił, mokk, molw, moly, mołodyc, monadnok, monokl, mordęg, mortir, morw, mozg, mórg, mrówkolwu, mrzeżn, mudr, mufte, mufti, muld, muppets, musztr, mutae, muwaszszah, mycorrhiz, mycorriz, myrr, nadaw, nadir, nadwątl, nakf, nakfa, nakfą, nakfę, nakfo, nakfy, narcyzi, nastoć, natomiastby, nazw, odpylń, odżelaź, oficjel, ofiklejd, ogdoad, oklapł, onąż, ongiś, onoż, onuc, oranżad, osęk, osłab, outdoor, ozoi, ożot, pacyf, paiż, pajac, pająk, pajok, pajsą, pajsę, pajso, pajuk, pańć, pardew, pardw, parr, paseo, paseos, pożądl, pójł, półbąk, pradżm, prakryti, prazjol, prażm, prestiż, prodiż, protopop, próchnu, próśb, przekąs, sibui, sikh, sikha, sikhu, sikhy, siorp, sirdab, sirocc, siroccu, skądciś, skądeś, skądsiś, skib, skidoo, skif, sztafaż, sztetł, sztof, sztolń, sztorc, sztuc, sztylp, szwenk, szwyc, szyfru, szypr, ścichapęk, świdw, świekr, świerzbu, tabbouleh, tacos, tael, tajęż, tajfun, tajgą, tajgę, tajgo, takyr, talmi, tamanduą, tamanduę, tamandui, tamanduo, tamanduy, tamg, tamgą, tamgę, tamgi, tamgo, tamta, tamtą, tartufe, taśm, taśma, taśmą, taśmę, taśmo, tatuaż, tayuc, technicsa, teff, tekke, temp, tenri, thai, tigr, tiurbe, tobół, tołpyg, tomahawk, tonf, toteż, toyot, trąbą, trąbę, trąbo, trefl, trip, trói, trójc, trwóg, trzeźwu, tsingtao, tsub, tsug, tuss, tussah, tyiyn, tymf, tynf, tyrp, tyrs, udżamaa, ugrzęzł, ugrzęźnijmyź, ultraproct, wytargł, wyżeł, wyżła, wyżły, yamah, yucc, yuccą, yuccę, yuppi, zachęt, zaćm, zaflegmi, zafr, zakomplekś, zakotw, zapętl, domr, dościgł, doyen, drajw, drajwu, drajwy, drozd, druh, druhu, dual, dubn, dubnu, duchn, dunst, durr, dwói, dylążu, dziegci, dziś, dziumdź, dziwło, dziwłu, dżag, dżaz, dżez, dżinn, dżip, dżum, eclipse, edta, edtą, edtę, efeb, efod, egri, eintopf, ekosez, ekscerpt, eliksir, enbu, epiloia, epiloią, epiloie, epiloię, epiloio, epizod, erhu, ersatz, eruw, erzherzog, eskaer, faen, fajf, fałsz, farfurń, fatyg, fecit, fejhoa, fejhoą, fejhoę, fejhoo, fejhoy, fellows, fengshui, fenig, fils, finf, firefly, firm, krąp, kreml, kroaz, kronprinz, kronprinzu, kryptogej, krzywd, krzyżm, księżmi, którąś, któreś, którzyś, kubb, kubbu, kulm, kulturkampf, kumć, kumys, kunżut, kupn, kurp, kuruc, kutw, kwagg, kweb, kwinoą, kwinoę, kwinoo, kyat, lacun, lambd, lambda, lambdą, lambdę, lambdo, lanug, larendogr, lądolód, leitmotiv, leiw, lekyt, lennu, lepr, lesb, lincoln, lisp, lituus, liwr, logaed, luau, lumpex, lutz, lycr, łosoś, łunochod, łyżew, łyżw, łyżwa, łyżwą, łyżwę, łyżwo, łyżwy, maalox, maar, maceb, macew, mafalde, mahajug, mahdi, mahr, makagig, małż, mamałyg, mambwe, mamuń, mandap, mangab, manitou, maracui, marathi, marchołt, masmix, matm, matrix, matronae, mayday, mąciwod, meches, mediae, megapyr, megil, mekk, menhir, meszuge, metax, metaxą, metaxę, metaxo, mezuz, mężuś, miau, miąs, micr, micw, micwa, micwą, micwę, micwo, micwy, midi, miejsc, miejscu, międzywęźlu, mięsu, mikrohut, mikropył, nielwi, niemr, nieuk, patiu, pawąz, pawęz, pawęż, pepeg, perfum, perłę, pesew, pewex, piegż, piegża, piegżą, piegże, piegżę, piegżo, piegży, pierś, pierzg, piętr, pigw, pinyin, pirs, pizze, plazmodezm, plebs, plebsu, pleciug, plymouth, płaskl, płóz, płóź, podsiń, pojędrń, pokląskw, przesył, przyboś, przyjm, przylg, przymiotn, przyszw, przywr, przyzb, pseud, psui, pulp, pułk, punc, pyrd, rabbi, raceboat, rachic, rachub, rallye, rapt, recto, redow, reggae, renju, renklod, repoussoir, rococ, skuą, skuę, skuo, skuy, słęp, słonaw, słońc, smerf, smerfuś, smileys, smirnoff, snigg, sojuz, solfeż, spah, spahis, spąg, spektr, spiż, spluw, spłyć, spójrz, spray, sprayuj, sprue, sprzężai, spyż, statuą, statuę, statuo, statuy, stealth, sterygm, steyr, stoa, stoą, stoę, stołb, stołbu, stołpu, stoo, stopiw, stoy, stóg, strąk, strąt, sucre, sulky, summ, sundae, sunn, sylf, sylw, szag, szajgec, szarif, szczeżui, szefic, szejk, szkafut, szlifą, szlifę, szlir, szmaragd, szmaragda, szmaragdu, wtranżol, wuef, wychędóż, wychłodł, wychyń, wyczha, wydęb, wydm, wydól, wylęg, wyrw, wyrwidąb, wysmukl, wysp, zwięz, zwięźlo, zwiotcz, zwischenruf, żanr, żłob, żołn, żonuń, żożob, żółw, żuwn, firn, fiume, fleut, fluidex, fluor, folg, fondue, fontaź, foyer, francuz, frawaszi, freikorps, frrr, fuji, funky, gaio, galeas, gamoń, gańdźa, gańdźą, gańdźe, gańdźę, gańdźi, gańdźo, gańdźom, garig, geek, gees, geez, genre, gentilhomme, genuą, genuę, genuo, genuy, geod, gędźb, giemz, giemza, giemzą, giemzę, giemzo, giemzy, gieroj, gilz, gilza, gilzą, gilzę, gilzo, gilzy, girls, gluon, gofr, goguś, goodbye, gospoś, goud, grafiń, gril, grizzly, gróźb, grzęz, guir, gułag, gymnospermae, gyyz, hafn, hafnu, hajc, hakenkreuze, half, hangyl, hanys, hańba, hańbą, hańbę, hańbo, hańby, haridźan, hathajog, hełm, hełmu, hełmy, highbrow, hobbits, hokku, holm, hoyą, hoyę, hoyo, hucuł, hufca, hufcu, hulk, hydrox, hymn, igloo, inro, interlingua, interlinguę, interlinguo, interlinguy, interlingw, interrexi, odezw, poliu, polja, polje, polji, polju, pontiac, pontifex, poroh, porohu, potańc, potorfi, unplugged, upup, urorrhoeą, urorrhoee, urorrhoeę, urorrhoei, urorrhoeo, urzeczow, uszebti, uszlachca, wajśja, wajśją, wajśje, wajśję, wajśji, wajśjo, wampum, wapn, wapń, watah, wągr, wcir, wedgwood, werteb, wewte, widm, wiedźm, wiedźma, wiedźmą, wiedźmę, wiedźmo, więc, więcby, więźb, wikijap, wilg, willys, wirtuoz, witeź, witz, włóku, włósi, wnęk, woal, wobec, wobłę, wojsk, woltyż, wołgą, wołgę, wołgo, wóda, wódą, wódę, wódo, wróżb, wróżd, wróżdę, wróżdo, wskrześ, bruzd, brzdęk, brzóz, brzytw, buddą, buddę, buddo, buddy, bujd, bulb, bulw, burżua, bzzz, cacci, candid, cardox, carioc, casanova, casanovą, casanovę, casanovo, casanovy, ceorl, cetn, chabaź, chałw, chałwa, chałwą, chałwę, chałwo, chałwy, chappe, charme, chełp, chełst, chintz, chintzy, chłopyś, chmyz, chomąto, chreią, chreie, chreię, chreio, chuć, chutbe, chyr, chyż, ciemn, ciemń, cioć, ciosłę, ciućm, ciżb, cnót, compact, compaq, compaqa, compaqom, compaqów, compaqu, config, cornish, córć, cuscut, cytopyge, cytr, czarcikęs, czepig, czeremch, czerymoi, czip, czółnu, czuh, czyha, czyiś, czyiż, czyjaś, czyjąś, czyjąż, czyjś, daewoo, daimyo, darmsztadt, darmsztadtu, darśan, dekokt, delft, demijohn, deseń, destrojs, destroy, dhoti, didżei, dikk, dławidud, dłut, docusoap, netsuke, ngui, nicpoń, nieb, niechby, niecoś, niedodm, niedołęg, nieduć, nife, nike, niktże, nilgau, noścą, noścę, nośco, noys, nózi, nurse, nurzybób, obiit, obje, obuwi, obydwu, rostbef, roślęż, rough, roughu, rozedm, rozglifi, rozkołys, rozwidl, ruad, rugby, rząp, rzemiosł, rzeź, rzępoł, rzęs, saab, sacr, sadhu, samobói, samojed, samoż, sangh, sangha, sanghą, sanghę, sangho, sankhja, sankhją, sankhje, sankhję, sankhji, sankhjo, scab, schmaltz, schmalz, schmalze, schmalzu, sedn, sejf, selw, semseyit, serir, sfrancuź, shoji, zarzuel, zawre, zazęb, zdeb, ześwieccz, zgag, zgiełk, zgręz, ziąb, ziębiw, ziębl, zimn, zineb, zliś, znowuż, znuż, zołz, zołzą, zołzę, zołzo, zołzy, zwiezd.

O, teraz się wzburzony Czytelnik wydrze na mnie z wielką pretensją, że co to niby za polszczyzna jest: nurse? destroy? obiit? Panie, toż to jakaś ściema jest, idźmy z tego durnego bloga i chodźmy poczytać jakieś fajne czasopisma opiniotwórcze! A tymczasem naga prawda jest taka, że te słówka są jak najbardziej polskie. Niedowiarków kieruję na http://sjp.pl

No dobra. Teraz coś całkiem innego – spróbujmy wyszukać wszystkie wyrazy, w których po literze ć lub ś pojawia się samogłoska. Zna ktoś takie? Mi przychodzi do głowy tylko „zadośćuczynić” oraz „ćakra” i „aćarja” (te dwa ostatnie znam bo gram na kurnik.pl a tam takie słówka to codzienność). Zobaczmy co w tej kwestii ma do powiedzenia nasz SQL-owy kuchcik Bartolini Bartłomiej:

SELECT  slowo
FROM    words
WHERE   slowo LIKE '%[ść][aeouiyęą]%';

Efekt: 135 słówek, z czego trzynaście form podstawowych: ćakra, ćapati, ćatni, ćela, ćwierćarkuszowy, darśana, zadośćuczynić, aćarja, śakti, śikhara, śilpaśastra, śiwaizm i śudra. Szczególnie do gustu przypadł mi wyraz śilpaśastra – tu zbitka ś+samogłoska występuje dwukrotnie. Ha.

Wkrótce planuję dorzucić jeszcze parę statystyk odnośnie częstotliwości występowania poszczególnych liter, odległości między literami i tak dalej. Wiedza kompletnie bezużyteczna, ale jakże piękna 😉

Tymczasem na zakończenie dziś kawał (niestety, tylko w języku Lengłidż – proszę sobie przetłumaczyć we własnym zakresie):

The tachyon leaves. The bartender says: „We don’t serve your kind here.” A tachyon walks into a bar.

Autor: xpil

Po czterdziestce. Żonaty. Dzieciaty. Komputerowiec. Krwiodawca. Emigrant. Rusofil. Lemofil. Sarkastyczny. Uparty. Mól książkowy. Ateista. Apolityczny. Nie oglądam TV. Uwielbiam matematykę. Walę prosto z mostu. Gram na paru instrumentach. Lubię planszówki. Słucham bluesa, poezji śpiewanej i kapel a’capella. || Kliknij tutaj po więcej szczegółów ||

Dodaj komentarz

2 komentarzy do "Dać rzeczy słowo"

Powiadom o
avatar
Sortuj wg:   najnowszy | najstarszy | oceniany
pendragon
Gość

Się nie wydrę tylko zastanowię się ponuro, czy to mój ojczysty język się tak rozwinął, czy to ja zostałem na emigracji w tyle i straciłem z nim kontakt bo nie wiem co znaczy polskie słowo "zwischenruf" albo takie np. "kronprinzu". Jak rzekłeś większości końcówek bym nie dopasował do członów, z pewną częścią całych wyrazów jakoś bym dał radę, ale cała lista na pierwszy rzut oka nie kojarzy się z polszczyzną. Z kwerend wychodzą niezłe czasem klocki. Dowcipu nie zrozumiałem, więc mój lengłidż też kuleje. Pora umierać.