Szógyakoriság 2025. tavasz (május -június)

Szógyakoriság 2025. tavasz (május -június)

1. Adatbázis és tábla létrehozása

CREATE DATABASE szogyak CHARACTER SET utf8mb4 COLLATE utf8mb4_hungarian_ci;

USE szogyak;

CREATE TABLE szavak (

azon INT PRIMARY KEY,

szoto VARCHAR(100),

szofaj ENUM('fn', 'mn', 'ige', 'hsz'),

gyakori INT

);

Ezután a szo10000.txt fájlt be lehet importálni például a MySQL Workbench vagy egy LOAD DATA parancs segítségével:

LOAD DATA INFILE '/path/to/szo10000.txt'

INTO TABLE szavak

CHARACTER SET utf8mb4

FIELDS TERMINATED BY '\t'

LINES TERMINATED BY '\n'

IGNORE 1 LINES

(azon, szoto, szofaj, gyakori);

2. (2ige500) – Legalább 500000-szer előforduló igék szótöve

SELECT szoto

FROM szavak

WHERE szofaj = 'ige' AND gyakori >= 500000;

3. (3brmellek) – "br"-rel kezdődő melléknevek és gyakoriságuk

SELECT szoto, gyakori

FROM szavak

WHERE szofaj = 'mn' AND szoto LIKE 'br%';

4. (4hatar10) – 10 leggyakoribb határozószó

SELECT szoto

FROM szavak

WHERE szofaj = 'hsz'

ORDER BY gyakori DESC

LIMIT 10;

5. (5szofajok) – Szófajonkénti szótőszám

SELECT szofaj, COUNT(*) AS szotokesz

FROM szavak

GROUP BY szofaj;

6. (6tobb) – Szótövek, amelyek legalább 3 különböző szófajhoz tartoznak

SELECT szoto

FROM szavak

GROUP BY szoto

HAVING COUNT(DISTINCT szofaj) >= 3;