Katera črka je najpogostejša. Pogostost uporabe črk v ruščini

Poglejte tipki "F" in "J" na tipkovnici in videli boste majhne kaveljčke. To je naš vodnik po svetu tipkanja na dotik.

Ko sem začel preučevati tipkanje na dotik, sem se soočil z občutkom, da je v naši postavitvi nekaj narobe. Šlo je za neskladje med pogostostjo pojavljanja črk v ruščini in njihovo lokacijo na tipkovnici.

Katera je po vašem mnenju najpogostejša črka v ruščini? In če bi bili na "polju čudežev", katero črko bi najprej navedli? Najpogostejša črka je "O", najmanj pogosta pa "F". Niti ene domače ruske besede ni, ki bi se začela s črko "F".

Tu je tabela verjetnostne porazdelitve črk v ruskih besedilih:

Verjetnost

Verjetnost

Verjetnost

Verjetnost

Črka "F" se pojavlja 45-krat manj kot "O" in zavzema enako priročno mesto kot "O". Kdo je bil tisti, ki je sprejel ta standard? Odgovor na to vprašanje boste našli v članku Tragedija vejice: "... pomislite, vejica je veliko bolj pogosta kot pika, medtem ko je vejica z velikimi črkami. Tega ni v nobenem jeziku sveta, razen v ruščini ...".

Po pregledu tabele lahko vidite naslednje: če želite slepo tipkati, se lahko naučite lokacije ne vseh črk, ampak samo na primer 20 - pojavijo se v več kot 90% primerov. Ne verjamem, da si oseba, ki pogosto tipka, ne more zapomniti lokacije tipk in delati, ne da bi jih pogledala. Vse je stvar navade. Upoštevajte: v kateri koli službi, kjer se ureja papirologija, operaterji gledajo na tipkovnico, čeprav tipkajo zelo hitro.

Toda pri pripravi postavitve sem spoznal verjetnost je bila upoštevana. Samo ona je bila zasnovana za tiste ... ki natisne med gledanjem na tipkovnici!

Preprosto je opaziti, da se vse najpogosteje pojavljane črke nahajajo v polju neposredne vidljivosti, manj običajne pa na obrobju.

Z angleško postavitvijo so stvari nekoliko slabše:

programi za tipkanje na dotik. Veliko jih je, ocene si lahko ogledate na http://www.urikor.net. Izbral sem Solo in Stamina. Odločil sem se začeti s Solo. Izkazalo se je, da je plačan, vendar je bil na voljo demo. Za dokončanje 1! vaja tipkanja Potrebna sta 2 znaka prebrati več kot 10 strani – nekakšen »simulator« za hitro branje.

In potem te ne spustijo skozi, dokler ne prebereš vsega in izpolniš standarda. Že skoraj sem hotel odstraniti program, ko sem prejel e-pošto s strani Solo, kjer so se zanimali za moj napredek. Pismo je bilo dolgo in pomislil sem: "Bravo, naučili so se hitro tipkati in vsem pisati velike črke."

Toda po natančnem pregledu pisma sem ugotovil, da ga je sestavil robotski odzivnik, čeprav ga je podpisala oseba. Zdaj razumem, zakaj so me v vprašalniku toliko spraševali o mojih interesih in barvi las. Solo sem izbrisal.

Sam sem delal s programom Stamina. Narejeno je z dušo! Lahko se celo ne ukvarjate s programom, ampak ga prenesete zaradi ene reference. To je najbolj smešen citat vseh časov!


Kako si zapomnim ključe?
"fiwa" in "oldzh" se boš hitro naučil. Vsak prst s črko. Skupaj že 8! Nisem jih učil v Stamini, ampak v programu s strani http://www.urikor.net. In potem sem si zapomnil same gibe. Na primer, pri učenju tipkanja na dotik ima veliko ljudi težave s črko "in". Ko sem položil prste na "fiwa" in "oldzh", da bi pritisnil tipko "in", moram popolnoma obrniti desni kazalec.

Pri takem obratu lahko udarim samo tipko "in". Za vsak prst sem si zapomnil naslednje gibe: "p" - levi kazalec v levo, "k" - gor, "e" - gor in desno itd.

Težave: ker postavitev ni optimizirana za tipkanje na dotik, se izkaže, da se podobne črke med seboj zrcalijo, to so tipke "a" in "o", "k" in "r". In kar je še zanimivo: podane so vaje za kazalce istočasno!, tj. istočasno se učite "a" in "o", "e" in "n", "p" in "r".

Po mojem mnenju to narobe - v možganih je zmeda. Vsaj jaz sem včasih zmeden. Ko se učite tipkanja na dotik, pomislite na gibe – potem se je težko znova naučiti. Mimogrede, nekatere ženske imajo težave z delom na tipkovnici, saj zaradi dolgih nohtov pritiskajo na druge tipke.

In ko sem se vsega naučila in se odločila, da bom tipkala na slepo, je prišel naslednji faza - "lenoba". Vsak dan sem moral veliko tipkati in ker je hitrost pri kukanju večja, sem ves čas kukal. Po nekaj mesecih sem premagal samega sebe in zlepljena vsi ključi z nalepkami iz video kaset.

Pozor: če ne zapečatiš ključev, te bo navada premagala. Ko delam na tipkovnicah, kjer so vidne črke, me mika, da bi pokukal. Zdaj ni več poti nazaj in to je prvi članek, napisan popolnoma na slepo.

Zakaj ga potrebujem. Zaenkrat sem globoko zadovoljen. Hitrost je še vedno nekoliko manjša kot pri kukanju in še vedno obstajajo napake, vendar sem že med tipkanjem tega članka opazil, kako se hitrost poveča in včasih pozabim, nato pa pogledam - natisnjeno je. Kot da zavest odstranjuje blokade.

Zanimivo je opazovati, kako se učiš sam, saj takih izkušenj ne bo več. Zdaj se nameravam naučiti igrati klavir. Mislim celo, da znam igrati (!), Samo spomniti se je treba.

P.S.
Minilo je eno leto. Tipkam le na slepo in pri veliki hitrosti. Če delate za računalnikom, se vsekakor naučite tipkati na slepo. Lažje je, kot si mislite.
Tukaj je majhen zapis Inne Igolkine o tem, kako se je naučila tipkati na slepo.

Ali veste, da nekatere črke abecede najdemo v besedah ​​pogosteje kot druge ... Poleg tega je pogostost samoglasnikov v jeziku višja od soglasnikov.

Katere črke ruske abecede so najbolj ali najmanj pogoste v besedah, ki se uporabljajo za pisanje besedila?

Statistika se ukvarja z identifikacijo in preučevanjem splošnih vzorcev. S pomočjo te znanstvene smeri je mogoče odgovoriti na zgornje vprašanje s štetjem števila vsake črke ruske abecede, uporabljenih besed, izbiro odlomka iz del različnih avtorjev. Zaradi lastnega interesa in dolgčasa lahko vsak naredi po svoje. Skliceval se bom na statistiko že izvedene študije ...

Ruska abeceda je cirilica. V času svojega obstoja je šla skozi več reform, zaradi česar je nastala sodobna ruska abeceda, ki vključuje 33 črk.

o - 9,28 %
a — 8,66 %
e - 8,10 %
in - 7,45 %
n - 6,35 %
t - 6,30 %
p - 5,53 %
c - 5,45 %
l - 4,32 %
c — 4,19 %
k - 3,47 %
n - 3,35 %
m - 3,29 %
y - 2,90 %
e - 2,56 %
jaz - 2,22%
s — 2,11 %
b - 1,90 %
h - 1,81 %
b - 1,51 %
d - 1,41 %
th - 1,31 %
h - 1,27 %
yu - 1,03 %
x - 0,92 %
g - 0,78 %
w - 0,77 %
c - 0,52 %
u - 0,49 %
f - 0,40 %
e - 0,17 %
b — 0,04 %

Ruska črka z največjo pogostnostjo v uporabi je samoglasnik " O«, kot je bilo tukaj pravilno predlagano. Obstajajo tudi značilni primeri, kot je " OBRAMBNA SPOSOBNOST«(7 kosov v eni besedi in nič eksotičnega ali presenetljivega; zelo poznano ruskemu jeziku). Velika priljubljenost črke "O" je v veliki meri posledica takšnega slovničnega pojava, kot je polni samoglasnik. Se pravi "mraz" namesto "mraz" in "zmrzal" namesto "pene".

In na samem začetku besed je soglasnik " p". Tudi to vodstvo je samozavestno in brezpogojno. Najverjetneje je v razlagi veliko število predpon s črko "P": re-, pre-, pre-, pre-, pro- in druge.

Frekvenca črk je osnova kriptoanalize.

Napisal smešen php skript. Prevozil sem vsa besedila na Spectatorju za jezik. Skupno je v besedilih uporabljenih 39110 različnih besednih oblik. Koliko različnih besede- je težko definirati. Da bi se nekako približal tej številki, sem vzel samo prvih 5 črk besede in jih primerjal. Izkazalo se je 14373 takih kombinacij. Z velikim nategom lahko temu rečemo besednjak "Spectator".

Nato sem vzel besede in jih pregledal glede pogostosti črk. V idealnem primeru bi morali vzeti nekakšen slovar, zaradi popolnosti. Nemogoče je odgnati besedila, potrebne so le edinstvene besede. V besedilu se nekatere besede ponavljajo pogosteje kot druge. Tako smo dobili naslednje rezultate:

o - 9,28 %
a - 8,66 %
e - 8,10 %
in - 7,45 %
n - 6,35 %
t - 6,30 %
p - 5,53 %
c - 5,45 %
l - 4,32 %
c - 4,19 %
k - 3,47 %
n - 3,35 %
m - 3,29 %
y - 2,90 %
e - 2,56 %
i - 2,22 %
s - 2,11 %
b - 1,90 %
h - 1,81 %
b - 1,51 %
g - 1,41 %
th - 1,31 %
h - 1,27 %
yu - 1,03 %
x - 0,92 %
w - 0,78 %
w - 0,77 %
c - 0,52 %
u - 0,49 %
f - 0,40 %
e - 0,17 %
b - 0,04 %

Za tiste, ki gredo na "polje čudežev", vam svetujem, da si zapomnite to tabelo. In pokličite besede v tem vrstnem redu. Tako se na primer zdi, da se taka "običajna" črka "b" uporablja manj pogosto kot "redka" črka "s". Prav tako je treba zapomniti, da v besedi niso samo samoglasniki. In da če ste uganili en samoglasnik, potem morate začeti hoditi po soglasnikih. In poleg tega je beseda uganjena natančno po soglasnikih. Primerjaj: "** a** in * e" in "cf * vn * t *". V obeh primerih je to beseda "primerjaj".

In še en premislek. Kako ste se naučili angleščine? Se spomniš? E pero, e svinčnik, e miza. Kar vidim, o tem pojem. In pomen? .. Kako pogosto izgovorite besedo "svinčnik" v običajnem življenju? Če je naloga naučiti govoriti čim hitreje in čim bolj učinkovito, potem je treba temu primerno tudi učiti. Analiziramo jezik, izpostavimo najpogosteje uporabljene besede. In začnemo se učiti od njih. Če želite več ali manj govoriti angleško, je dovolj le tisoč in pol besed.

Še ena potegavščina: sestaviti besede iz črk naključno, vendar ob upoštevanju pogostosti pojavljanja, tako da je videti kot običajne besede. V prvih desetih "naključnih" besedah ​​s štirimi črkami se je pojavil "osel". V naslednjih petdesetih - besedi "hitenje" in "NATO". Ampak, žal, obstaja veliko disonantnih kombinacij, kot sta "bltt" ali "nrro".

Zato naslednji korak. Vse besede sem razdelil na dvočrkovne kombinacije in jih začel naključno (vendar ob upoštevanju pogostosti ponavljanja) združevati. Jeklo v velikih količinah bo povzročilo besede, podobne "normalno". Na primer: "koivdiot", "voabma", "apy", "depoid", "debyako", "orfa", "poesnavy", "ozza", "chenya", "retoria", "urdeed", "utoichi", "quiet", "boots", "gravda", "ababap", "obarto", "eyluet", "lyarezy", "myni", "bromomer" in celo "todeby st.

Kam se prijaviti ... možnosti so. Na primer, napišite generator lepih korporativnih igrivih imen. Za jogurte. Na primer "memoliso" ali "utororerto". Ali - generator futurističnih verzov "Burliuk-php": "opeldiy miaton, linoaz okmiaya ... deesopen odeson."

In obstaja še ena možnost. Treba poskusiti ...

Nekaj ​​statističnih podatkov o uporabi ruskih besed:

  • Povprečna dolžina besede je 5,28 znakov.
  • Povprečna dolžina stavka je 10,38 besed.
  • 1000 najpogostejših lem pokriva 64,0708 % besedila.
  • 2000 najpogostejših lem pokriva 71,9521 % besedila.
  • 3000 najpogostejših lem pokriva 76,5104 % besedila.
  • 5000 najpogostejših lem pokriva 82,0604 % besedila.

Po objavi sem prejel to e-pošto:


Pozdravljen Dmitrij!

Po analizi članka »Jezik te bo pripeljal v Kijev« in njegovega dela, kjer opisuješ svoj program, se je porodila ideja.
Scenarij, ki ste ga napisali, se mi zdi, da absolutno ni v večji meri namenjen "polju čudežev", ampak nečemu drugemu.
Prva najbolj razumna uporaba rezultatov vašega skripta je določitev vrstnega reda črk pri programiranju gumbov za mobilne naprave. Da, da - vse to je potrebno v mobilnih telefonih.

Razdelil sem ga v valovih ()

Nadaljnja porazdelitev po gumbih:
1. Vse črke iz prvega vala gredo 4 gumbe v prvo vrstico
2. Vse črke iz drugega vala so tudi na preostalih 4 gumbih v isti prvi vrstici
3. Vse črke iz tretjega vala gredo tja na preostala dva gumba
4. 4,5 in 6 valovi gredo v drugo vrstico
5. Valovi 7,8,9 gredo v tretjo vrstico, 9. val pa gre v celoti (kljub navidezno velikemu številu črk) v tretjo vrstico 9. gumba, tako da lahko 10. gumb pustimo pod vsemi vrstami ločil (pika, vejica itd.).

Mislim, da je vse jasno in tako, brez podrobnih pojasnil. A vseeno, ali lahko s svojo skripto (vključno z ločili) obdelate besedila naslednje vsebine:

In potem razloži statistiko? Se mi je zdelo? da besedila čim bolj odsevajo našo sodobno govorico in tako govorimo kot pišemo sms.

Najlepša hvala v naprej.

Torej obstajata dva načina za analizo pogostosti ponavljanja črk. 1. način. Vzemite besedilo, v njem poiščite edinstvene (ne ponavljajoče se) besedne oblike in jih analizirajte. Metoda je dobra za gradnjo statistike o besedah ​​ruskega jezika in ne o besedilih. 2. način. Ne iščite edinstvenih besed v besedilu, ampak pojdite naravnost na štetje pogostosti ponavljanja črk. Pogostost črk dobimo v ruskem besedilu in ne v ruskih besedah. Če želite ustvariti tipkovnice in druge stvari, morate uporabiti to posebno metodo: to so besedila, ki se vnesejo na tipkovnico.

Tipkovnice naj ne upoštevajo le pogostosti črk, ampak tudi najpogostejše besede (besedne oblike). Ni tako težko uganiti, katere besede so najpogosteje uporabljene: to so, prvič, uradni deli govora, ker je njihova vloga, da služijo vedno in povsod, in zaimki, katerih vloga ni nič manj pomembna: nadomestiti katero koli stvar / osebo v govoru (to, on, ona). No, glavni glagoli (biti, reči). Glede na rezultate analize zgoraj naštetih besedil sem dobil najbolj »popularne« besede: »in, ne, v, kaj, on, jaz, na, z, ona, kako, ampak, on, to, da, ampak, vse, ona, je bilo, tako, potem, rekel, za, ti, oh, y, on, jaz, samo, za, jaz, bi, ja, ti, od, je bil, ko, od, za, še, zdaj, so, rekli, že, on, ne, je bil , ona, biti, no, ne, če, zelo, nič, tukaj, jaz, do, jaz, to, morda, tisto, prej, mi, oni, ali, bili, so, kot ali, ona ”in tako naprej.

Če se vrnemo k tipkovnicam, je očitno, da morajo biti na tipkovnici kombinacije črk »ne«, »kaj«, »on«, »on« in druge čim bližje druga drugi, ali če ne blizu, potem na nek najbolj optimalen način. Treba je opraviti raziskavo o tem, kako natančno se prsti premikajo po tipkovnici, poiskati najbolj »udobne« položaje in vanje postaviti najpogosteje uporabljene črke, ne pozabiti pa na kombinacije črk.

Težava je, kot vedno, enaka: tudi če vam uspe ustvariti edinstveno tipkovnico, kaj storiti z milijoni ljudi, ki so že navajeni na qwerty / yutsuken?

Glede mobilnih naprav... Verjetno je smiselno. Vsaj črke "o", "a", "e" in "in" morajo biti popolnoma na isti tipki. Ločila po pogostosti uporabe: , . - ? ! "; :)(

Pogostost uporabe črk v ruščini

Ali veste, da nekatere črke abecede najdemo v besedah ​​pogosteje kot druge ... Poleg tega je pogostost samoglasnikov v jeziku višja od soglasnikov.

Katere črke ruske abecede so najbolj ali najmanj pogoste v besedah, ki se uporabljajo za pisanje besedila?

Statistika se ukvarja z identifikacijo in preučevanjem splošnih vzorcev. S pomočjo te znanstvene smeri je mogoče odgovoriti na zgornje vprašanje s štetjem števila vsake črke ruske abecede, uporabljenih besed, izbiro odlomka iz del različnih avtorjev. Zaradi lastnega interesa in dolgčasa lahko vsak naredi po svoje. Skliceval se bom na statistiko že izvedene študije ...

Ruska abeceda je cirilica. V času svojega obstoja je šla skozi več reform, zaradi česar je nastala sodobna ruska abeceda, ki vključuje 33 črk.

o - 9,28 %
a — 8,66 %
e - 8,10 %
in - 7,45 %
n - 6,35 %
t - 6,30 %
p - 5,53 %
c - 5,45 %
l - 4,32 %
c — 4,19 %
k - 3,47 %
n - 3,35 %
m - 3,29 %
y - 2,90 %
e - 2,56 %
jaz - 2,22%
s — 2,11 %
b - 1,90 %
h - 1,81 %
b - 1,51 %
d - 1,41 %
th - 1,31 %
h - 1,27 %
yu - 1,03 %
x - 0,92 %
g - 0,78 %
w - 0,77 %
c - 0,52 %
u - 0,49 %
f - 0,40 %
e - 0,17 %
b — 0,04 %

Ruska črka z največjo pogostnostjo v uporabi je samoglasnik " O«, kot je bilo tukaj pravilno predlagano. Obstajajo tudi značilni primeri, kot je " OBRAMBNA SPOSOBNOST«(7 kosov v eni besedi in nič eksotičnega ali presenetljivega; zelo poznano ruskemu jeziku). Velika priljubljenost črke "O" je v veliki meri posledica takšnega slovničnega pojava, kot je polni samoglasnik. Se pravi "mraz" namesto "mraz" in "zmrzal" namesto "pene".

In na samem začetku besed je soglasnik " p". Tudi to vodstvo je samozavestno in brezpogojno. Najverjetneje je v razlagi veliko število predpon s črko "P": re-, pre-, pre-, pre-, pro- in druge.

Frekvenca črk je osnova kriptoanalize.

Znano je, da postavitev črk na tipkovnici tiskarskega stroja ali osebnega računalnika ni naključno sestavljena, temveč upošteva določena pravila. Tako se najpogosteje uporabljene črke nahajajo v osrednjem delu tipkovnice, manj pogoste pa ob robovih. Znano je tudi, da se samoglasniki uporabljajo pogosteje kot soglasniki. Ti podatki so bili pridobljeni s posebno formulo v nacionalnem korpusu ruskega jezika.

Najbolj uporabljeni samoglasniki

Nenavadno je, da je črka "o" vodilna po številu uporab v pisnem govoru, tako med samoglasniki kot med soglasniki. Sledita mu "a" in "in", za tem pa se začnejo soglasniki. Po mnenju strokovnjakov je pogostost uporabe črke "o" ena desetinka odstotka, pogostost drugih samoglasnikov pa se giblje od sedem do osem stotink odstotka.

Najbolj priljubljeni soglasniki

Najpogosteje uporabljen soglasnik je "n". Hkrati se največje število besed v ruščini začne s črko "p". Med samoglasniki na tej podlagi prednjači "o".

Najredkejši soglasnik v ruskem govoru je črka "f", ki se uporablja v besedah, ki so prišle iz tujih jezikov, pa tudi v onomatopeji, kot je "smrčanje".

Takšna statistika je lahko uporabna pri sestavljanju tavtogramov. Bistvo te besedne igre je sestaviti koherentno zgodbo, v kateri se mora vsaka beseda začeti z isto črko.

Podobni članki

2023 liveps.ru. Domače naloge in že pripravljene naloge iz kemije in biologije.