Sedm věcí, které jsme se naučili z analýzy 515 milionů slov

Sedm věcí, které jsme se naučili z analýzy 515 milionů slov

Miliony lidí hrají Wordle každý den, sdílejí, diskutují a debatují o tom, jak se snažili vyhrát.

Poprvé jsme analyzovali, jak si hráči vedli v půl miliardě těchto her Wordle za poslední rok, a porovnali jejich výsledky s doporučenými strategiemi WordleBot.

Zde je sedm věcí, které jsme se naučili:

Bylo napsáno mnoho, mnoho slov lepší Úvodní slovo Wordle. Ve skutečnosti byla odpověď na tuto otázku jednou z motivací vývoje WordleBot. V jeho robotickém mozku je několik slov – Seznam, Jeřáb, stopy – Dostanou schvalovací razítko robota, že vedou k řešení s nejmenším průměrným počtem odhadů.

Ale pro hráče lidských Wordle je nejčastějším úvodním slovem okraj Rozloučenís Můj hlasdalší čtyřpísmenné slovo, nezůstává pozadu.

Strategie se zdá být logická: vymyslete samohlásky a ostatní umístíte na správné místo. Robot by nikdy raději nezačal tímto způsobem, ale je možné, že nejlepší strategie pro počítač není nejlepší strategií pro člověka.

Naše nová analýza však ukazuje, že počínaje Rozloučení nebo Můj hlas Ve skutečnosti to znevýhodňuje lidské hráče. Kolik z jednoho?

V průměru hráči, kteří začínali s Rozloučení K vyřešení svých slov potřebovali asi o třetinu více tahů než hráči, kteří s nimi začínali Seznamčímž se během roku přidá až 132 dalších kurzů.

Ještě horší: zatímco 1,7 procenta Seznam Začátečníkům se v průměru nedaří vyřešit Wordle s pravděpodobností selhání Rozloučení Více než zdvojnásobil na 3,6 procenta.

Nemůžeme s jistotou říci, že počínaje Rozloučení důvody Hráči na tom hůř. Mohou to být hráči, kteří začínají Rozloučení Jsou to spíše příležitostní hráči nebo se méně zajímají o řešení nejmenšího počtu hádanek. Koneckonců, ne každý se stará o syrovou efektivitu, když hraje. Můžeme však říci, že mezi 30 nejoblíbenějšími úvodníky Wordle Rozloučení Nejhorší výkon.

Obecně platí, že průměrný uživatel WordleBotu vyřeší hádanku asi o čtvrtinu tahu méně než průměrný hráč Wordle.

Robot začíná s Seznam Každý den, který může být nudný. Lidští hráči, osvobození od břemene matematické přesnosti, mohou během roku měnit své Wordle. (Hráči často vysvětlují svůj denní výběr v recenzi Wordle.)

Zde jsou hlavní úvodní řádky, které v určitých dnech vyskočily na popularitě:

  • Štědrý večer (24. prosince 2022): veselý

  • Štědrý den: veselý, Dárkové předměty, Ahoj

  • Nový Rok: oslava, let

  • Nový rok (1. ledna 2023): let, oslava, šťastný, Čerstvý

  • Super Bowl (12. února): vynikající

  • Valentýn: srdce, Milenec, Amor

  • Den svatého Patrika: šťastný

  • Velikonoce: Vstal, Králík

  • Korunovace Karla III. a Camilly (6. května): Koruna, Královský

  • Svátek práce: vyčerpání

Další zábavný vzor: oslava Každý víkend má mírnou špičku.

Ve výše uvedeném seznamu jsme vyloučili první odhady, které ten den sloužily jako Wordleho řešení.

Je to proto, že přibližně v 1 z každých 250 her dostane čtenář odpověď hned na první pokus. To se stává častěji, než byste čekali, pokud necháte věci náhodě, i když ne každý případ je nutně přímo podvádění.

Někteří mohou použít nové okno k dalším hádkám poté, co se jim nepodařilo vyřešit hádanku v šesti pokusech. Někteří mohou znovu zadat řešení, které našli na jiném zařízení, aby zachovali kontinuitu podnikání nebo otestovali technický problém. Jiní možná odpověď popletli, nebo ano, možná si ji vyhledali.

Zde můžete zjistit, která úvodní slova se postupem času stala populárnější. Rozloučení Je stále dominantní a jeho popularita se zvýšila jako první odhad.

Nárůst popularity outdoorových akcí – když „Rozloučení„Objeveno v Mini Crossword v srpnu – nebo od té doby, co se slovo objevilo jako řešení – Můj hlas 30. srpna Jeřáb Dne 21. června – jasno.

Nejobtížněji řešitelná slova začínají na J, končí na Y nebo někde obsahují dvojité písmeno. Těžší než všechna slova loni, oplatitMá všechny tři. Pět nejobtížnějších slov za poslední rok, měřeno počtem tahů k vyřešení:

  • oplatit (1. června): 5,82 cyklů k vyřešení

  • žolík (25. dubna): 5,69 cyklů k vyřešení

  • Chůva (3. června): 5,68 cyklů k vyřešení

  • Soudce (26. prosince): 5,57 cyklů k vyřešení

  • Žací stroj (22. února): 5,52 cyklů k vyřešení

Pokud měříte rychlostí řešení, je to nejtěžší slovní hádanka žolíkpřičemž řešení našlo pouze 71 procent hráčů.

Více než rok neexistuje žádný seznam řešení, na která by WordleBot mohl odkazovat. Místo toho bot přiřadí téměř každému pětipísmennému slovu v angličtině – všem 14 855 přijatým odhadům Wordle – pravděpodobnost, že je řešením. (Robot nemá žádnou roli při výběru slov, která se objeví jako řešení Wordle; pokud by ano, byl by tento úkol mnohem jednodušší.)

Většina těchto slov — od Smlouva na Zemek – Je považováno za příliš vágní na to, aby bylo považováno za potenciální řešení, a dává se mu nulová šance. Ve zbytku platí, že čím je slovo běžnější (měřeno podle toho, jak často se objevuje v New York Times od roku 2000), tím je pravděpodobnější, že jej bot přiřadí.

Většina slov, která se objevila jako řešení – vše od Angažovaný na mládeže – Dostali maximální možnou příležitost. Ale tu a tam se vloudí řešení, které robota překvapí. Jeho model řešení není dokonalý! Toto je oblast, kde chytrý lidský hráč může překonat robota.

Níže jsou uvedena řešení z minulého roku, která robota nejvíce překvapila, spolu s tím, co si robot myslel, že je pravděpodobné, že se objeví ve srovnání s nejběžnějšími slovy.

  • Anoda (5. srpna): 67,9 %

  • Matty (22. ledna): 73,2 %

  • borax (12. dubna): 81,2 %

  • Gobi (4. května): 86,0 %

  • revize (11. února): 89,4 %

Lidští hráči si mohou při hraní vybrat libovolné z přibližně 15 000 přijatých slov. Robot takové štěstí nemá.

Rozhodnutí, která slova byla dostatečně běžná, aby je bot doporučil, bylo rozhodnutí. Chceme, aby byl robot co nejzručnější. Na druhou stranu by nebylo užitečné mít bota, který by hráčům nadával, že nehádají slova jako AWDLS, larva nebo Yukj.

Zahrnutí dat z odhadů hráčů nám umožní více se zaměřit na slova, která bot doporučuje. V nadcházejících dnech odstraníme několik slov ze seznamu botů, čímž uvolníme místo pro přibližně 50 dodatků. Nová várka vědeckých termínů — Co je s tebou, řasy, boric A Můj uzel – Spolu s mnoha slovy souvisejícími s jídlem – Banco, Muriel, Chile, Umami A Pinto – objeví se (opět to nemá nic společného se skutečnými řešeními Wordle). Předpokládáme, že robot trávil více času čtením vědecké sekce a New York Times vaření.


Poznámka: V případech, kdy jsme odhadovali průměr, se neúspěšné hádanky počítaly jako 7,5 hádanek.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *