
Szógyakoriság 2025. tavasz (május -június)
Szógyakoriság 2025. tavasz (május -június)
1. Adatbázis és tábla létrehozása
CREATE DATABASE szogyak CHARACTER SET utf8mb4 COLLATE utf8mb4_hungarian_ci;
USE szogyak;
CREATE TABLE szavak (
azon INT PRIMARY KEY,
szoto VARCHAR(100),
szofaj ENUM('fn', 'mn', 'ige', 'hsz'),
gyakori INT
);
Ezután a szo10000.txt fájlt be lehet importálni például a MySQL Workbench vagy egy LOAD DATA parancs segítségével:
LOAD DATA INFILE '/path/to/szo10000.txt'
INTO TABLE szavak
CHARACTER SET utf8mb4
FIELDS TERMINATED BY '\t'
LINES TERMINATED BY '\n'
IGNORE 1 LINES
(azon, szoto, szofaj, gyakori);
2. (2ige500) – Legalább 500000-szer előforduló igék szótöve
SELECT szoto
FROM szavak
WHERE szofaj = 'ige' AND gyakori >= 500000;
3. (3brmellek) – "br"-rel kezdődő melléknevek és gyakoriságuk
SELECT szoto, gyakori
FROM szavak
WHERE szofaj = 'mn' AND szoto LIKE 'br%';
4. (4hatar10) – 10 leggyakoribb határozószó
SELECT szoto
FROM szavak
WHERE szofaj = 'hsz'
ORDER BY gyakori DESC
LIMIT 10;
5. (5szofajok) – Szófajonkénti szótőszám
SELECT szofaj, COUNT(*) AS szotokesz
FROM szavak
GROUP BY szofaj;
6. (6tobb) – Szótövek, amelyek legalább 3 különböző szófajhoz tartoznak
SELECT szoto
FROM szavak
GROUP BY szoto
HAVING COUNT(DISTINCT szofaj) >= 3;