2023-01-13 / 11 komentarzy

Redukujemy do absurdu, czyli żarcik programistyczny

Przeglądając blogosferę, natrafiłem niedawno na artykuł o liczbach pierwszych limerykowych. Są to pięciocyfrowe liczby pierwsze postaci AABBA gdzie A i B to dwie różne cyfry, A>0.

Liczb takich jest osiem: 11551, 33113, 33223, 33773, 77447, 77557, 99119, 99559.

Spróbowałem napisać program w Pythonie, który mi te liczby wyszuka. Temat jest banalny, dwie minuty później miałem już gotowca:

from sympy import isprime
results = []
for x in range(10):
    for y in range(10):
        n = 11001*x+110*y
        if(isprime(n)):
            results.append(n)
print(results)

Osiem linii kodu. Oczywiście natychmiast zadałem sobie pytanie czy można to jakoś skrócić. Na przykład, po co zapisywać wyniki pośrednie skoro można je na bieżąco wypisywać na ekran?

from sympy import isprime
for x in range(10):
    for y in range(10):
        n = 11001*x+110*y
        if(isprime(n)):
            print(n)

Co prawda wynik pojawia się teraz w odrobinę innym układzie (każda liczba w osobnej linijce), ale wynik to wynik.

Co by tu dalej... Można zastąpić dwie zagnieżdżone pętle for - jedną:

from sympy import isprime
for x, y in [[x, y] for x in range(10) for y in range(10)]:
    n = 11001*x+110*y
    if(isprime(n)):
        print(n)

Udało nam się zejść do pięciu linii kodu. Co prawda czytelność w linii numer 2 nieco spadła, ale nie ma tragedii. Kolejny pomysł: przełożyć wyliczenie zmiennej n do linii otwierającej pętlę:

from sympy import isprime
for n in [11001*x+110*y for x in range(10) for y in range(10)]:
    if(isprime(n)):
        print(n)

Już tylko cztery linie kodu, wyniki nadal poprawne. Czytelność... mogłaby być lepsza, ale da się to jeszcze w miarę zrozumieć. A co gdyby tak spróbować przefiltrować pod kątem pierwszości listę tworzoną w drugiej linii - w tej samej linii?

from sympy import isprime
for n in list(filter(lambda x: isprime(x), [11001*x+110*y for x in range(10) for y in range(10)])):
    print(n)

Udało nam się zejść do trzech linii kosztem znacznego pogorszenia czytelności. Ale wyniki nadal poprawne, więc kombinujemy dalej.

Hmmmm...

(pięć strzałów znikąd później...)

Hmmmm... Te liczby są raptem tylko pięciocyfrowe, nie potrzebujemy żadnego zaawansowanego algorytmu sprawdzania pierwszości, prawda? Wystarczy podzielić liczbę n przez każdą liczbę od 2 do pierwiastka z n zaokrąglonego w górę do pełnej całości - jeżeli nie dzieli się przez żadną z nich, to jest pierwsza.

Hmmmmmmm...

print(list(filter(lambda n: n>2 and len([i for i in range(2, int(n**0.5)+1) if n%i==0])==0, [11001*x+110*y for x in range(10) for y in range(10)])))

Krócej się już nie da 🙂

Dopisane 2 lata później:

Zapytałem Elemelka czy ma pomysł na krótszy kod i wypluł mi:

print([n for a in range(9)for b in range(10)for n in[11001*(a+1)+110*b]if a-b and all(n%i for i in range(2,n)if i*i<=n)])

Kod jest o 27 znaków krótszy od mojego, więc jednak się dało krócej 🙂

https://xpil.eu/d2s

11 komentarzy

Waldek pisze:

2023-01-13 o 14:45

Wersja ostatnia ma 148 znaków, podczas gdy pierwsza tylko 138.

Odpowiedz
1. xpil pisze:
  
  2023-01-13 o 15:11
  Słuszna uwaga. Jednakowoż po zapisaniu na dysku plik z pierwszą wersją ma 177 bajtów a z ostatnią – 148:
```
drwxr-xr-x  2 xpil xpil 4096 Jan 13 13:47 ./
drwxr-xr-x 61 xpil xpil 4096 Jan 10 19:57 ../
-rw-rw-r--  1 xpil xpil  148 Jan 13 15:08 limprim2.py
-rw-rw-r--  1 xpil xpil  177 Jan 13 15:08 limprim1.py
```
  Tak że tego.
  Odpowiedz
  1. Waldek pisze:
    
    2023-01-13 o 17:22
    
    Interesujące. Nie mam do czynienia z pythonem, więc lekko nie rozumiem, dlaczego jedna wersja nie zmieniła w ogóle długości, a inna powiększyła się aż o 39 bajtów, czyli o ponad 28%! Znaki końca wiersza mogą zajmować 7*2B=14B. Brakuje jeszcze 25B. Gdzie one są?
    
    Odpowiedz
    1. xpil pisze:
      
      2023-01-13 o 18:04
      
      Znaki końca wiersza zajmują 7 bajtów a nie 14, bo mam w tym pliku linuksowe (jednobajtowe: heksadecymalnie `0A`) znaki końca linii.
      
      Linie 1 – 8 mają następujące długości: 25, 12, 19, 23, 25, 23, 29, 14.
      Suma długości linii daje 170.
      170 plus 7 znaków końca linii daje łącznie 177. Wszystko się zgadza.
      
      Odpowiedz
Waldek pisze:

2023-01-13 o 18:35

Policzyłeś wiodące spacje linii! One są tylko polepszaczem optycznym dla programisty, nie są częścią wykonywanego kodu. Policz te prawdziwe znaki, jest ich 138+7=145. I pierwszy program nadal jest krótszy…

Odpowiedz
1. xpil pisze:
  
  2023-01-13 o 20:10
  Spacje wiodące są elementem składni Pythona. Po redukcji poczwórnych spacji do pojedynczych otrzymujemy:
```
-rw-rw-r--  1 xpil xpil  150 Jan 13 20:08 limprim1.py
-rw-rw-r--  1 xpil xpil  148 Jan 13 15:12 limprim2.py
```
  … czyli pojedyncza linia jest o 2 bajty krótsza od posiedmiorczej.
  Odpowiedz
  1. xpil pisze:
    
    2023-01-13 o 20:12
    
    P.S. „nie są częścią wykonywanego kodu.” jest prawdziwe dla wszystkich znaków obydwu wersji. Wykonuje się kod maszynowy skompilowany z pseudokodu skompilowanego z kodu źródłowego. Obstawiam, że w obydwu przypadkach ów kod maszynowy jest prawie taki sam (chociaż import biblioteki `sympy` może trochę namieszać…)
    
    Odpowiedz
    1. Waldek pisze:
      
      2023-01-14 o 19:39
      
      Rzeczywiście, pobawiłem się chwilę na online-python – przedziwny to język z wiodącymi spacjami. Jestem w szoku! Zwracam honor.
      Zauważyłem, że dwukropek otwiera blok, a wcięcia spacjami oznaczają przynależność do tego bloku – takie mało ekonomiczne { } lub begin end. Ewidentnie Python został wymyślony po to, aby pisać „krótkie” programy jednowierszowe. 🙂
      
      Odpowiedz
      1. xpil pisze:
        
        2023-01-14 o 20:16
        
        Python z założenia powstał jako język, w którym nie da się napisać źle sformatowanego kodu, bo wcięcia są interpretowane. Jedni mówią, że to kiepski pomysł, innym się podoba. Mi się podoba, chociaż pisałem przedtem całkiem sporo w C / C++ i tameczne nawiasy klamrowe też mi się podobały. Bo ja mało awanturujący się klient jestem 🙂
        
        Przy okazji, jeżeli „wcięty” blok składa się tylko z jednej linii, można ją umieścić w tej samej linii co dwukropek, o czym dowiedziałem się całkiem niedawno:
        
        zamiast
        
        cośtam: plonk
        
        można:
        
        cośtam: plonk
        
        Odpowiedz
rozie pisze:

2023-01-15 o 09:48

Nie wiem czy znasz zabawę zwaną Perl golf. Jeśli nie, to polecam wyszukanie. Dokładnie coś takiego wydajesz się uprawiać w Pythonie. Tylko nie masz precyzyjnych zasad. Znaczy nie wiadomo czy minimalizujesz ilość linii czy znaków.

Swoją drogą, to IMO średni sposob na naukę języka programowania w ogóle, a Pythona w szczególności. Priorytetem jest przecież czytelność, prawda?

Odpowiedz
1. xpil pisze:
  
  2023-01-15 o 10:15
  
  Prawda. Ale liczy się też zabawa – redukowanie programu do jak najmniejszej liczby linii (znaków, instrukcji itd itd) ma dla mnie aspekt rozrywkowy.
  
  Podobno każdy program w C da się zapisać w postaci jednej pętli for 🙂
  
  Odpowiedz

Dodaj komentarz Anuluj pisanie odpowiedzi

Jeżeli chcesz do komentarza wstawić kod, użyj składni:
[code]
tutaj wstaw swój kod
[/code]

Jeżeli zrobisz literówkę lub zmienisz zdanie, możesz edytować komentarz po jego zatwierdzeniu.