Zagadka słownikowo-geograficzno-algorytmiczna

Tym razem powędrujemy sobie słownikiem po mapie Polski.

Na chwilę obecną w Polsce mamy 16 województw. Każde z nich ma swoją nazwę. Na przykład "dolnośląskie" albo "warmińsko-mazurskie".

W języku polskim mamy na dzień dzisiejszy około 4.4 mln słów, przy czym pojęcie "słowo" zostało tu użyte w dość szerokim kontekście, ponieważ lista słów do pobrania ze strony sjp.pl zawiera zarówno słowa "zwyczajne" jak na przykład "stół" czy "dupa", jak też składanki wielowyrazowe, na przykład "break dance" czy "Boże Ciało", a nawet cudaki typu "vis-à-vis". Mamy tu mnóstwo zapożyczeń z innych języków, nazwy własne i różne inne klamoty. Skądś się przecież te 4.4 mln musiało wziąć.

Wprowadzimy sobie teraz na potrzeby dzisiejszej zagadki pojęcie "słowa niedopasowane". Są to dwa wyrazy, które nie mają ani jednej wspólnej litery.

Na przykład "stół" i "brukiew", albo "żółtawy" i "niebieski". Żadna litera pierwszego słowa nie występuje w drugim i vice versa.

No i teraz pytanie właściwe: nazwa którego z szesnastu polskich województw ma w słowniku najdłuższe słowo niedopasowane? Jakie to słowo?

Pytanie bonusowe w stylu mini-max: skoro nazwie każdego województwa można przypisać najdłuższe słowo niedopasowane (prawdopodobnie inne dla każdego województwa, z wyjątkiem pary "lubuskie" - "lubelskie" które mają identyczny zestaw unikalnych liter), to które z województw ma "najkrótsze-najdłuższe" słowo niedopasowane? Innymi słowy należy w słowniku znaleźć wyraz niedopasowany do któregoś z województw, który jest najdłuższy dla tego województwa, ale najkrótszy z całej piętnastki. Jakie to słowo?

Aby uniknąć niejednoznaczności, proszę ściągnąć listę słów z tej strony: https://sjp.pl/slownik/odmiany/, a listę nazw województw z Wikipedii: https://pl.wikipedia.org/wiki/Wojew%C3%B3dztwo#Stan_aktualny_%E2%80%93_16_wojew%C3%B3dztw

Uwaga: lista słów z odmianami jest w nieco dziwnym formacie: wszystkie formy danego słowa znajdują się w tej samej linii tekstu, oddzielone przecinkami. Trzeba to sobie przerobić do jakiegoś bardziejszego formatu we własnym zakresie.

Przypuszczam, że nie da się tego zadania rozwiązać bez wsparcia komputera. Przeczesać ponad cztery miliony słówek to nie przelewki. Jeżeli chcesz pochwalić się swoim kodem, będzie mi miło.

5 komentarzy

    1. Ja założyłem po cichu, że wielkość liter nie ma znaczenia, ale możesz zrobić analizę dla obydwu wariantów.

      1. Długie wyrazy są złożone z małych liter. Nawet niepoprawna, ale słynna “konstantynopolitańczykówna” zaczyna się od “k”. Tak, jak krakowianka.

    2. Wielkość liter ma znaczenie, podobnie jak to, czy traktować myślnik jako literę, czy nie. Ja normalizowałem do małych liter i traktowałem myślnik jak literę.

  1. Bawię się słowami, wybaczcie…

    ~~~~~~
    Zamiast nazw województw wpisałem nazwy ich stolic. Niektóre województwa mają dwie stolice! Wyszło coś takiego:

    najdłuższy z najdłuższych:
    kraków (34)
    niesiedemdziesięciosiedmioletniego
    niesiedemdziesięciosiedmioletniemu
    niesiedemdziesięciosześcioletniego
    niesiedemdziesięciosześcioletniemu

    Najkrótszy z najdłuższych:
    gorzów wielkopolski i zielona góra (12)
    buchtujących
    dłużyłybyśmy
    dżdżyłybyśmy
    jutubujących
    tytułujących

    ~~~~~~
    Jeszcze bonus dla Gospodarza – najdłuższy wyraz w słowniku:
    niedziewięćdziesięciopięcioipółletniego (39)

    i najdłuższe słowo niedopasowane do powyższego:
    jarmarkujmyż (12)

    ~~~~~~
    Teraz bonus dla wyborców przyszłego Prezydenta RP – najdłuższy wyraz złożony z różnych liter:
    uwspółrzędniającego (19)

    i najdłuższe słowo niedopasowane:
    myślmyż (7)     (to ten bonus, szkoda, że niedopasowany…)

    ~~~~~~
    Poza tym czuję się dobrze, ćwir ćwir i dziękuję za uwagę.

Leave a Comment

Komentarze mile widziane.

Jeżeli chcesz do komentarza wstawić kod, użyj składni:
[code]
tutaj wstaw swój kod
[/code]