Zagadka słownikowo-geograficzno-algorytmiczna

Tym razem powędrujemy sobie słownikiem po mapie Polski.

Na chwilę obecną w Polsce mamy 16 województw. Każde z nich ma swoją nazwę. Na przykład “dolnośląskie” albo “warmińsko-mazurskie”.

W języku polskim mamy na dzień dzisiejszy około 4.4 mln słów, przy czym pojęcie “słowo” zostało tu użyte w dość szerokim kontekście, ponieważ lista słów do pobrania ze strony sjp.pl zawiera zarówno słowa “zwyczajne” jak na przykład “stół” czy “dupa”, jak też składanki wielowyrazowe, na przykład “break dance” czy “Boże Ciało”, a nawet cudaki typu “vis-à-vis”. Mamy tu mnóstwo zapożyczeń z innych języków, nazwy własne i różne inne klamoty. Skądś się przecież te 4.4 mln musiało wziąć.

Wprowadzimy sobie teraz na potrzeby dzisiejszej zagadki pojęcie “słowa niedopasowane“. Są to dwa wyrazy, które nie mają ani jednej wspólnej litery.

Na przykład “stół” i “brukiew”, albo “żółtawy” i “niebieski”. Żadna litera pierwszego słowa nie występuje w drugim i vice versa.

No i teraz pytanie właściwe: nazwa którego z szesnastu polskich województw ma w słowniku najdłuższe słowo niedopasowane? Jakie to słowo?

Pytanie bonusowe w stylu mini-max: skoro nazwie każdego województwa można przypisać najdłuższe słowo niedopasowane (prawdopodobnie inne dla każdego województwa, z wyjątkiem pary “lubuskie” – “lubelskie” które mają identyczny zestaw unikalnych liter), to które z województw ma “najkrótsze-najdłuższe” słowo niedopasowane? Innymi słowy należy w słowniku znaleźć wyraz niedopasowany do któregoś z województw, który jest najdłuższy dla tego województwa, ale najkrótszy z całej piętnastki. Jakie to słowo?

Aby uniknąć niejednoznaczności, proszę ściągnąć listę słów z tej strony: https://sjp.pl/slownik/odmiany/, a listę nazw województw z Wikipedii: https://pl.wikipedia.org/wiki/Wojew%C3%B3dztwo#Stan_aktualny_%E2%80%93_16_wojew%C3%B3dztw

Uwaga: lista słów z odmianami jest w nieco dziwnym formacie: wszystkie formy danego słowa znajdują się w tej samej linii tekstu, oddzielone przecinkami. Trzeba to sobie przerobić do jakiegoś bardziejszego formatu we własnym zakresie.

Przypuszczam, że nie da się tego zadania rozwiązać bez wsparcia komputera. Przeczesać ponad cztery miliony słówek to nie przelewki. Jeżeli chcesz pochwalić się swoim kodem, będzie mi miło.

Zapisz się
Powiadom o
guest
5 komentarzy
Inline Feedbacks
Zobacz wszystkie komentarze
5
0
Zapraszam do skomentowania wpisu.x
()
x