Return to Website

F.R. Scrabble - FORUM

Propuneri pentru Adunarea Generala a F.R. Scrabble
si alte propuneri si dezbateri de interes general
- 2001 - 2002 -

Forumul este inchis, discutiile pot fi doar citite, dar nu se pot posta raspunsuri sau comentarii.
Pentru a comenta unul din subiectele de aici, utilizati noul forum al F.R. Scrabble:

www.scrabblero.ro/sforum

F.R. Scrabble - FORUM
This Forum is Locked
Author
Comment
View Entire Thread
Cum au fost stabilite frecventa si valoarea

1. Cum au fost stabilite frecventa si valoarea literelor la scrabble in limba romana; cum se poate ajunge la valorile ideale.



Va trimit din nou la articolul din Stiinta si Tehnica, februarie 1982, scris de inginerii Serban Teodoru si Ioan Comanescu, cei care au stabilit frecventa si valoarea literelor la scrabble in limba romana:






FRECVENTA si VALOAREA LITERELOR LA SCRABBLE ÎN LIMBA ROMÂNĂ




Am început prin a număra 10.000 de litere din fondul principal de cuvinte din limba română si din texte reprezentative. Apoi am calculat frecventa de apariție a unei litere, din care a rezultat valoarea atribuită acesteia. în graficul de mai jos arătăm modul de stabilire a numărului (frecventei) si valorii literelor din limba română pentru jocul de scrabble. Bineînteles, am tinut seama si de procentul vocalelor din limba română, asa cum rezultă din lucrarea Fonostatistica limbii române de A. BOCERIC ALEXANDRESCU, Ed. Academiei R.S.R., 1969.




Urmeaza tabelul, pe care il puteti gasi descarcand anul 1982 de la http://underworld.fortunecity.com/boardgame/34/ninel/istoria-zip.htm.




Ni s-a părut interesant să verificăm dacă structura literelor jocului scrabble în limba română are aceleasi caracteristici principale ca cea din limba franceză. Astfel am întocmit următorul tabel comparativ:











































Caracteristici







Lb.


franceză







Lb. română




Valoarea literelor




Numărul literelor




% litere cu valoare 1




Nr. maxim litere val. 1




Nr. minim litere val. 1




Raport M1 / m1




Raport vocale în joc




Raport vocale în limbă




1...10




100 + 2




73 %




15




5




3




44 %




43,4 %




1...10




98 + 2




76 %




11




4




2,75




41,8 %




42,7 %






---Sfarsitul articolului---





Orice studii pe texte duc la rezultate, concluzii care nu tin seama de dinamica jocului. Cred ca a mai buna metoda de a gasi niste valori ideale este de a intreba pur si simplu jucatorii care sunt aceste valori (daca vreti putin mai complicat, poate atarna mai greu parerea jucatorilor cu experienta mai mare). Si apoi sa fie facuta media. Am propus, in gluma, de 1 Aprilie 1985 sau 1986, asemenea valori. Le gasiti la aceeasi adresa.




------------------------------


2. De ce cred eu ca nu se mai poate schimba nimic.




Un standard se schimba foarte greu, de obicei atunci cand esti obligat sa te aliniezi. Daca o faci doar ca sa perfectionezi ceva, risti sa-ti pierzi personalitatea si sa se duca dracu totul!




(text trimis pe lista [ro-scrabble], 17.02.02)

Doua numaratori posibile

1. Frecventa de aparitie a literelor. 536708 cuvinte, toate formele de flexiune.




Prima coloana: litera;


Coloana a doua: frecventa cu care apare;


coloana a treia: procentaj (doua zecimale);


coloana a patra: procentaj (rotunjire).




A - 624998 - 11.63 => 12


B - 74102 - 1.38 => 1


C - 234607 - 4.36 => 4


D - 109515 - 2.04 => 2


E - 558161 - 10.38 => 10


F - 62564 - 1.16 => 1


G - 77183 - 1.44 => 1


H - 38767 - 0.72 => 1


I - 774109 - 14.4 => 14


J - 16510 - 0.31 => 0


K - 738 - 0.01 => 0


L - 359665 - 6.69 => 7


M - 160067 - 2.98 => 3


N - 257351 - 4.79 => 5


O - 339223 - 6.31 => 6


P - 131066 - 2.44 => 2


Q - 108 - 0 => 0


R - 485214 - 9.03 => 9


S - 260261 - 4.84 => 5


T - 396274 - 7.37 => 7


U - 275911 - 5.13 => 5


V - 51861 - 0.96 => 1


W - 272 - 0.01 => 0


X - 10550 - 0.2 => 0


Y - 182 - 0 => 0


Z - 75860 - 1.41 => 1


------------------------



Total litere: 5375119





2. Frecventa de aparitie a literelor. 55780 cuvinte din LOC-2, fara forme de flexiune.



A - 60178 - 13.31 => 13


B - 7780 - 1.72 => 2


C - 25309 - 5.6 => 6


D - 9959 - 2.2 => 2


E - 40170 - 8.88 => 9


F - 6610 - 1.46 => 1


G - 8818 - 1.95 => 2


H - 4630 - 1.02 => 1


I - 52213 - 11.55 => 12


J - 1646 - 0.36 => 0


K - 159 - 0.04 => 0


L - 21048 - 4.65 => 5


M - 15332 - 3.39 => 3


N - 26772 - 5.92 => 6


O - 32638 - 7.22 => 7


P - 14030 - 3.1 => 3


Q - 33 - 0.01 => 0


R - 37076 - 8.2 => 8


S - 20815 - 4.6 => 5


T - 36765 - 8.13 => 8


U - 18120 - 4.01 => 4


V - 5324 - 1.18 => 1


W - 67 - 0.01 => 0


X - 1164 - 0.26 => 0


Y - 66 - 0.01 => 0


Z - 5484 - 1.21 => 1


-----------------------



Total litere: 452206




Prima coloana: litera;


Coloana a doua: frecventa cu care apare;


coloana a treia: procentaj (doua zecimale);


coloana a patra: procentaj (rotunjire).





Se observa diferenta la literele A, E, I, L si U data de formele plurale si de articulari. Interesanta ar fi o analiza a cuvintelor admise pe vremuri (vezi Initiere in Scrabble, p. 8-9).





(text trimis pe lista [ro-scrabble], 17.02.02)

Foarte interesant. Qui prodest?


Foarte interesant. Mai ales ca referinta.


Cu unele observatii:


  • De fapt pe noi nici nu ne priveste direct frecventa ca atare. Propuneti si noile valori pentru "caramelele" cu care se joaca! Altfel, totul e doar o simpla comunicare stiintifica.


  • La o corespondenta directa frecventa-valoare, plaja de valori ar fi prea larga si tot timpul ar trebui sa ne uitam la piesele jocului sau la o lista de atribuire a valorilor ca sa calculam punctaje, ceea ce mi se pare un mare inconvenient, se pierde din timpul de gandire, ca sa nu mai vorbim de riscul crescut de eroare.


  • Nu pot fi de acord cu rotunjirea la 0. Concluzia ar fi ca acele litere nu apar in limba, ceea ce este eronat.


  • Bun, schimbam tot. Cum convingem pe toata lumea sa renunte la vechiul sistem si sa purceada la cumpararea altor jocuri?


  • Deja exista multe voci care afirma ca de fapt o lista de cuvinte mai apropiata de realitatea limbii, cu toate formele de flexiune, din toate marile dictionare, ar trebui de fapt sa depaseasca 1.000.000 de cuvinte!


  • La fel ca la trecerea de la sistemul cu note de la 1 la 10 la punctaje de la 1 la 100 (la olimpiadele scolare), acuratetea este mai mare, dar nu uitati ca vorbim de fapt de un joc si orice schimbare trebuie sa ne foloseasca si sa nu induca inconveniente care sa plictiseasca jucatorii, sa faca jocul neatractiv, nespectaculos.


  • Pentru toate limbile exista aceleasi discutii. Totusi, din ratiuni comerciale si tinand de conservatorismul mintii umane mai ales la cei peste


    40 de ani - care ii invata si pe cei mici (zicem tot Casa Scanteii si nu Palatul Presei Libere, ITB si nu RATB, Piata Moghioros, nu Celibidache, etc....), pana acum, in peste 50 de ani, nimeni nu a schimbat in lume jocurile initial lansate. Qui prodest? Aceasta este de descoperit si de folosit ca argument.




    (text trimis pe lista [ro-scrabble], 17.02.02)

    --- --- --- --- --- --- --- --- ---

    Replying to:

    1. Frecventa de aparitie a literelor. 536708 cuvinte, toate formele de flexiune.




    Prima coloana: litera;


    Coloana a doua: frecventa cu care apare;


    coloana a treia: procentaj (doua zecimale);


    coloana a patra: procentaj (rotunjire).




    A - 624998 - 11.63 => 12


    B - 74102 - 1.38 => 1


    C - 234607 - 4.36 => 4


    D - 109515 - 2.04 => 2


    E - 558161 - 10.38 => 10


    F - 62564 - 1.16 => 1


    G - 77183 - 1.44 => 1


    H - 38767 - 0.72 => 1


    I - 774109 - 14.4 => 14


    J - 16510 - 0.31 => 0


    K - 738 - 0.01 => 0


    L - 359665 - 6.69 => 7


    M - 160067 - 2.98 => 3


    N - 257351 - 4.79 => 5


    O - 339223 - 6.31 => 6


    P - 131066 - 2.44 => 2


    Q - 108 - 0 => 0


    R - 485214 - 9.03 => 9


    S - 260261 - 4.84 => 5


    T - 396274 - 7.37 => 7


    U - 275911 - 5.13 => 5


    V - 51861 - 0.96 => 1


    W - 272 - 0.01 => 0


    X - 10550 - 0.2 => 0


    Y - 182 - 0 => 0


    Z - 75860 - 1.41 => 1


    ------------------------



    Total litere: 5375119





    2. Frecventa de aparitie a literelor. 55780 cuvinte din LOC-2, fara forme de flexiune.



    A - 60178 - 13.31 => 13


    B - 7780 - 1.72 => 2


    C - 25309 - 5.6 => 6


    D - 9959 - 2.2 => 2


    E - 40170 - 8.88 => 9


    F - 6610 - 1.46 => 1


    G - 8818 - 1.95 => 2


    H - 4630 - 1.02 => 1


    I - 52213 - 11.55 => 12


    J - 1646 - 0.36 => 0


    K - 159 - 0.04 => 0


    L - 21048 - 4.65 => 5


    M - 15332 - 3.39 => 3


    N - 26772 - 5.92 => 6


    O - 32638 - 7.22 => 7


    P - 14030 - 3.1 => 3


    Q - 33 - 0.01 => 0


    R - 37076 - 8.2 => 8


    S - 20815 - 4.6 => 5


    T - 36765 - 8.13 => 8


    U - 18120 - 4.01 => 4


    V - 5324 - 1.18 => 1


    W - 67 - 0.01 => 0


    X - 1164 - 0.26 => 0


    Y - 66 - 0.01 => 0


    Z - 5484 - 1.21 => 1


    -----------------------



    Total litere: 452206




    Prima coloana: litera;


    Coloana a doua: frecventa cu care apare;


    coloana a treia: procentaj (doua zecimale);


    coloana a patra: procentaj (rotunjire).





    Se observa diferenta la literele A, E, I, L si U data de formele plurale si de articulari. Interesanta ar fi o analiza a cuvintelor admise pe vremuri (vezi Initiere in Scrabble, p. 8-9).





    (text trimis pe lista [ro-scrabble], 17.02.02)

  • Doar cu titlu informativ!

    Am trimis datele doar cu titlu informativ!




    Nici eu nu cred ca ar trebui neaparat schimbat ceva, cel putin pina nu se mai schimba limba romana . Am fost eu curios sa vad ce iese, de aceea am facut tabelele cu pricina, si fiindca tot aparuse discutia m-am gindit sa le trimit. Insa trebuie sa constat ceva. Frecventele pe care le-am trimis eu sint pentru ortografia cu â nu cu î. Sint curios cit de multe I-uri ar fi fost in cazul respectiv daca acum ies 12-14...


    Mi-a placut mult observatia dv. cu conservatorismul mintii umane. Din nefericire, si in politica si in administratie si peste tot exista aceeasi problema...

    Intai trebuie precizat clar fondul de cuvinte

    In ce priveste toata discutia despre schimbarea frecventei literelor, parerea mea umila este ca se pune putin caruta inaintea calului. Jocul de scrabble e una, textele scrise si frecventa de folosire a unor cuvinte e cu totul altceva. In primul rand trebuie precizat clar fondul de cuvinte ce se doreste admis pentru scrabble. Sunt mult militanti, printre care si eu, pentru largirea fondului de cuvinte admis acum, prin adaugarea unor cuvinte din alte dictionare decat DEX-ul - si ma refer la DLRM, DOOM, DN. Cred ca abia atunci cand vom avea aceasta discutie incheiata, eventual printr-o carte de tipul oficialului de scrabble francofon putem discuta coerent despre concordanta frecventei literelor jocului cu cea existenta in dictionar.




    In rest in toata discutia care se poarta despre modul de stabilire a frecventei literelor cred ca se face o mare confuzie reducand calculul frecventei literelor la GRADUL DE APARITIE A LOR IN CELE MAI UTILIZATE CUVINTE DIN LIMBA ROMANA. O sa incerc sa dau cateva exemple in incercarea de a fi mai explicit.




    a) La stabilirea textelor e una sa folosesti textele lui Creanga de exemplu si altceva texte de Blaga, Cioran sau Preda de exemplu. Frecventa folosirii unor cuvinte si implicit a unor litere e modificata radical SI NU ARE NICI O LEGATURA CU FONDUL DE CUVINTE ADMIS DE SCRABBLE.




    b) Cuvinte foarte folosite la Scrabble (vechi si noi) - de tipul GHIZDAV, LUXEMBURGHEZ, BRANDENBURGHEZ, FOJGAI etc. evident ca vor fi foarte putin folosite in vorbirea curenta dar asta nu inseamna ca ele nu trebuie sa fie luate in calcul la stabilirea frecventei literelor din joc.




    c) Chiar daca toata lumea foloseste cuvantul A NASTE, aceasta nu inseamna ca nu se poate folosi si A ACUSA (chiar daca este existent numai in DN) si ca daca este acceptat la SCRABBLE nu trebuie sa joace si el un rol in stabilirea frecventei literelor.




    Argumentul cu lumea care are cumparate niste jocuri si nu mai da bani pe altele e putin pueril, din mai multe motive :




    a) Chiar si acum sunt producatori de jocuri foarte slabi si literele din joc SUNT PUTIN DIFERITE DE CELE OFICIALE - te poti trezi cu 3 de B, 7 de S etc., in afara de aceasta e foarte usor sa se discute cu un producator sa fabrice numai seturi de litere sau chiar completari care sa fie la un pret mic.




    b) Vine tineretul din spate si ei nu si-au cumparat jocuri si, dupa mine, ei sunt cei care pot relansa jocul la ce a fost candva.




    c) Totul trebuie privit ca o investitie. Suntem prea saraci ca sa purtam astfel de discutii lunar sau bilunar etc.






    Ce-ar trebui facut - repet, dupa umila mea parere? In primul rand si in primul rand STABILIREA CLARA A UNUI FOND DE CUVINTE ADMIS PENTRU JOC, eventual mai bogat decat cel actual si adus mai la zi. La aceasta hotarare trebuie tinut cont de faptul ca nu suntem o putere economica precum Franta sa facem modificari anuale si ca acest fond trebuie gandit pe un termen mai larg 10-15 ani. Unirea eforturilor a putinilor entuziasti care au mai ramas in editarea unei liste a cuvintelor din acest FOND DE CUVINTE ADMIS. Abia dupa acea se poate stabili in mod cat mai real si corect frecventa literelor pentru joc pur si simplu cu ajutorul unui soft se poate calcula ce procent de aparitie are o litera in acest fond. Poate ca ma repet: chiar daca rezultatele obtinute vor fi ciudate, comparativ cu limba vorbita sau folosita (sa zicem 4 de B), in mod sigur vor fi mai stranse de ce e admis la jocul de scrabble si va da posibilitatea folosirii mai dese a cuvintelor rare care de altfel e si esenta jocului.




    Odata stabilit fondul de cuvinte si legat de el setul de litere, se poate discuta cu o editura sa tipareasca acest FOND DE CUVINTE (fac aici o paranteza, intrucat lucrez oarecum in domeniu: am remarcat tendinta celor


    care cumpara jocul, chiar daca nu doresc sa faca performanta, sa joace cat mai corect. Inexistenta unei liste clare creaza un moment de debusolare pentru ca fiecare, chiar la nivel de joc acasa, se gandeste cum sa rezolve aceasta problema daca joaca cu cineva, deci practic existenta unui fond tiparit e nu numai utila ci foarte necesara). Daca e prea scump procesul de tiparire, se poate discuta cu un producator de jocuri ca aceasta sa aiba inclus si cd-ul continand fondul de cuvinte admis (explozia de calculatoare din ROMANIA exista si va continua) si, daca nu se solicita drepturi de autor, pretul actual al jocului nu ar avea de ce sa creasca prea mult daca se asociaza acest cd. Dupa aceasta se poate trece la o popularizare intensiva, atat pe paginile web cat si prin regulamentul inclus in interiorul jocului, a fondului de cuvinte admis, a eventualelor soturi de cautare joc etc. Consider sincer ca aceasta este sansa de a atrage noi adepti ai jocului si mai fideli pentru ca - spre deosebire de sah, go, unde totul e clar: astea sunt piesele, asa se joaca - la noi la scrabble e putina ceata in sensul ca deocamdata un om obisnuit nu stie cum e mai corect sa joace, ce dictionar sa aleaga etc.








    (text trimis pe lista [ro-scrabble], 17.02.02)

    Frecvente (si colaterale)

    Perfect de acord cu florin, care a pus punctele pe toate iurile. de indata ce vom juca "scrabble adevarat" si nu ciuntit ca astazi, problema nu doar ca se poate, dar va si trebui pusa! numai si de dragul unei verificari formale! nu vad cauza pentru care am considera-o un tabu (cu atit mai mult d.p.d.v. comercial, din motivele expuse de antevorbitori).

    Care este, de fapt, problema?


    Vorbim de un joc. Care are niste conventii. Stabilite acum mai bine de 20 de ani. Aveti dovada ca aceste conventii s-au fundamentat pe o baza stiintifica, cu argumente destul de solide.




    Desigur ca nu exista "valori ideale", pentru ca sunt prea multe criterii de analiza.




    Cel mai important este ca toti sa cunoastem clar conventia, sa nu avem nelamuriri si sa o putem aplica usor si uniform, fara sa apara disfunctionalitati, toti cei care am jucat, jucam sau vom juca vreodata.


    Nu am prea avut probleme sau crize in acest context de cand se joaca scrabble in Romania.




    Poate ma insel, deci va rog spuneti mai limpede: CARE ESTE DE FAPT PROBLEMA ?


    E primul punct care trebuie formulat daca ne-am propune sa schimbam ceva aici.




    Trebuie sa stim de ce ar trebui sa abandonam toate jocurile vandute si sa cerem aparitia altora.






    (text trimis pe lista [ro-scrabble] la 17.02.02)



    --- --- --- --- --- --- --- --- ---

    Replying to:

    Nu am inteles care este modalitatea de a stabili ponderea fiecarei litere. Conform articolului din http://www.racai.ro/awd/awd23/vlad.html (in "Limbaj si


    tehnologie") avem frecvente de aparitie ale literelor care nu prea corespund cu valorile din regulamentul actual (nu ar trebui modificate? Mai ales avind in vedere ca s-a trecut si la grafia cu î din a, ceea ce ar conferi un mai multi "a" in joc si evident, mai putini "i"). Oricum frecventele trebuie facute pe texte reale nu pe lista din dictionar (deoarece anumite [cuvinte] apar mai des decit altele in vorbirea curenta, deci si ponderile alocate trebuie sa fie mai mari).




    (text trimis pe lista [ro-scrabble] la 12.02.02)

    Trecerea la "i din a" a fost o schimbare radicala

    Cred ca numai in Romania, care e demult tara tuturor posibilitatilor - mai ceva ca S.U.A, e posibila o schimbare atat de radicala a listelor de cuvinte prin trecerea la scrisul cu i din a si totusi sa se mentina aceasi structura de litere a jocului. Daca nici aceasta nu a fost o modificare esentiala banuiesc ca modificare esentiala va fi numai cand se va schimba alfabetul nostru cu cel japonez, de exemplu.

    Nu cred ca e o problema adevarata

    Sper ca nu va propuneti in mod serios sa schimbati si asta.





    Cred ca e o discutie foarte interesanta, dar mai mult teoretica. De fapt, e un fel de tema ciclica - toti ne-am pus intrebarea asta, la un moment dat. E chiar o tema pasionanta, mai ales cind stirneste si alte subiecte conexe - de exemplu, largirea fondului de cuvinte (asta da, tema de dezbatut! Si cred ca abia incepe... desi, tot da sa-nceapa, de niste ani buni...).





    In viltoarea discutiei, nu stiu daca ati avut curiozitatea sa vedeti articolul pe care ni l-a semnalat Radu Borza (vezi adresa de mai jos). E un articol foarte interesant - fireste, tot teoretic. M-am si amuzat imaginindu-mi cum as aplica eu formula P (Xi / Xi-1) ca sa aflu care e probabilitatea ca, dintr-o grupa de multi-scrabble, nouarul cautat cu infrigurare sa contina secventa -PR-... -





    Glumesc, desigur, dar articolul e foarte interesant, vi-l recomand.





    Multumesc si lui AdiJu pentru tabelele comparative.


    Chiar nu mi s-a parut deloc, privindu-le, ca ne-am indeparta prea mult de ADEVAR, jucind cu frecventele si valorile actuale. Intr-adevar, crize majore care sa "strice" cu totul partidele n-au fost.





    Sigur, si mie mi s-a parut (si mi se va mai parea) de multe ori ca sint prea multi de P, D, sau C (mai ales cind vin la gramada, intr-o partida de libere... dar acolo e alta problema - de "nascut-cu-caita" sau nu!).





    Una peste alta, sa multumim cerului cã noi, românii, avem plurale vocalice!


    Nu mai stiu unde-am citit ca jocul in engleza avea initial 4 (patru) de S, dar... cum a aparut problema pluralului englezesc - s-a mai suplimentat, pina la urma, cu unul...





    Acolo, criza! Si sa-i vezi, cind nu mai stiu ce sa faca cu I-urile... Nu, Dane?





    Care vra sa zica: NU. Nu cred ca trebuie sa darimam, iar, totul. Stiu ca e o pasiune nationala, dar... Mai bine inventam alt joc!





    Numai bine si noroc la litere.