HukukBERT - Türk Hukuku için Alan Spesifik Yapay Zeka Modeli

21 GB temizlenmiş hukuki corpus üzerinde, gelişmiş maskeleme stratejileriyle eğitilmiş — Türkiye'nin en kapsamlı hukuki dil modeli.

TurkHukuk.ai Ekibi Şubat 2026 GitHub Repo

HukukBERT

Doğal dil işleme (NLP) alanındaki gelişmeler, hukuk teknolojisi (LegalTech) uygulamalarına önemli kapılar açmıştır. Ancak Türk hukuku özelinde mevcut çalışmalar ciddi veri kısıtlarıyla sınırlı kalmıştır.

Buna karşılık, yurtdışında hukuk alanına özgü daha geniş kapsamlı çalışmalar yapılmıştır. Örneğin İngilizce hukuk metinleri üzerinde geliştirilen LEGAL-BERT (Chalkidis ve ark., 2020) yaklaşık 12 GB büyüklüğünde bir veri seti kullanılarak eğitilmiştir. Bu durum, Türk hukuku için daha kapsamlı ve yüksek hacimli veri setlerine dayalı modellere duyulan ihtiyacı açıkça ortaya koymaktadır.

HukukBERT, bu sınırlamaları aşmak amacıyla içtihat, mevzuat ve literatür verilerini içeren 21 GB boyutunda temizlenmiş bir Türk hukuk corpusu üzerinde eğitilmiştir. Bu ölçek, terminolojik kapsama ve çeşitlilik açısından önceki çalışmalara kıyasla belirgin bir sıçramaya karşılık gelmektedir.

21 GBTemizlenmiş Corpus
~9MBelge (Ham)
48KWordPiece Vocab
19 saatH200 SXM Eğitim

Sonuçlar

Eğitilen model, hukuki kavram tahmininde (Hukuki Cloze Testi) genel amaçlı Türkçe BERT modellerine ve diğer alan-spesifik modellere karşı kayda değer bir üstünlük sergilemektedir:

Hukuki Cloze Testi — Model Karşılaştırması (N=750)

turkhukuk.ai / HukukBERT

84.40%Top-1 Accuracy

98.80%Top-3 Accuracy

95% CI — Top-1: [81.63%, 86.82%] · Top-3: [97.74%, 99.37%]

Mürsit-Large

78.80%Top-1

97.73%Top-3

BERTurk-Legal

75.47%Top-1

96.00%Top-3

BERTurk-128k

71.87%Top-1

95.20%Top-3

TabiBERT

68.13%Top-1

95.33%Top-3

BERTurk-cased

63.73%Top-1

93.47%Top-3

turkish-large-bert

61.60%Top-1

91.20%Top-3

HukukBERT, sıralamada kendisine en yakın model olan Mürsit-Large'a kıyasla Top-1 doğruluğunda +5.60 puan, standart BERTurk modeline kıyasla ise +20.67 puan mutlak iyileşme sağlamıştır.

Farkı Gösteren Örnekler

Sayıların ötesinde, aşağıdaki örnekler HukukBERT'in hukuki terminolojiye olan hakimiyetini somut olarak ortaya koymaktadır:

Mükerrirlere özgü infaz rejiminin ve cezanın infazından sonra denetimli serbestlik tedbirinin, [MASK], suçu meslek edinen kişi veya örgüt mensubu suçlu hakkında da uygulanmasına hükmedilir.

FAILturkish-large-berttaksirli suçlu (0.30) · tesadüfi suçlu=0.25 · asi suçlu=0.23 · itiyadi suçlu=0.22

FAILMürsit-Largetaksirli suçlu (0.80)

FAILBERTurk-Legaltaksirli suçlu (0.82)

FAILTabiBERTasi suçlu (0.41) · taksirli suçlu=0.36 · tesadüfi suçlu=0.20

FAILBERTurk-casedasi suçlu (0.46) · taksirli suçlu=0.24 · itiyadi suçlu=0.15 · tesadüfi suçlu=0.15

FAILBERTurk-128ktaksirli suçlu (0.69)

WINHukukBERTitiyadi suçlu (0.96) · Vocab: örgüt=0.672, terör=0.056, mükerrir=0.052

Mirasbırakanın vefatı ile birlikte, mirasçılara kanun gereği bir bütün olarak geçen malvarlığına [MASK] denir.

FAILturkish-large-bertmiras (0.98)

WINMürsit-Largetereke (0.94)

FAILBERTurk-Legalmiras (0.59) · tereke=0.30

FAILTabiBERTmiras (0.95)

FAILBERTurk-casedmiras (0.98)

FAILBERTurk-128kmiras (0.92)

WINHukukBERTtereke (0.96) · Vocab: tereke=0.924, miras=0.037

İcra mahkemesinin para cezasına ilişkin olmayan nihai kararlarına karşı kural olarak [MASK] kanun yoluna başvurulabilir.

FAILturkish-large-bertitiraz (0.85)

WINMürsit-Largeistinaf (0.84)

FAILBERTurk-Legalitiraz (0.85)

FAILTabiBERTitiraz (0.87)

FAILBERTurk-caseditiraz (0.45) · istinaf=0.30 · karar düzeltme=0.19

WINBERTurk-128kistinaf (0.67)

WINHukukBERTistinaf (0.82) · Vocab: temyiz=0.622, istinaf=0.313, itiraz=0.056

Sözleşmenin taraflarından birinin, sözleşmede öngörülen edimini ifa etmemesi durumunda, diğer tarafın sahip olduğu hakları kullanabilmesi için borçluya uygun bir [MASK] vermesi veya verdirmesi kural olarak zorunludur.

FAILturkish-large-bertceza (0.48) · tazminat=0.38 · ihtarname=0.14

WINMürsit-Largemehil (0.96)

WINBERTurk-Legalmehil (0.97)

FAILTabiBERTtazminat (0.83)

FAILBERTurk-casedihtarname (0.58) · mehil=0.22

FAILBERTurk-128kceza (0.52) · tazminat=0.29 · mehil=0.16

WINHukukBERTmehil (1.00) · Vocab: mehil=0.807, süre=0.114, önel=0.049

Veri Hazırlama

Veri Kaynakları

Corpus oluşturulurken aşağıdaki birincil kaynaklardan yararlanılmıştır:

İçtihat ve mevzuat verileri — mevzuat.adalet.gov.tr
Anayasa Mahkemesi kararları — kararlarbilgibankasi.anayasa.gov.tr
Türkiye Barolar Birliği Dergisi — tbbdergisi.barobirlik.org.tr
Çeşitli akademik kaynaklar (tezler, makaleler)

Ham Corpus

Tablo 1 — Ham Corpus Dağılımı
Alan	İçerik	Belge Sayısı	Boyut (GB)
MEVZUAT	Mevzuat	16.114	0,31
İÇTİHAT	Yerel Hukuk	526.432	4,58
İÇTİHAT	KYB	161	<0,01
HUKUK	Sözlük	2.449	<0,01
İÇTİHAT	İstinaf	208.901	1,90
İÇTİHAT	Yargıtay	9.584.616	16,23
İÇTİHAT	AYM	21.185	0,43
HUKUK DIŞI	Vikipedi	294.382	0,76
HUKUK	Tez	154	0,02
İÇTİHAT	Danıştay	329.862	2,65
HUKUK	Ceza	644	0,03
HUKUK	TBB	1.981	0,09
HUKUK	GSU	381	0,02
TOPLAM		10.987.262	27,02

Mükerrer ve Benzer Belgelerin Temizlenmesi

Hukuki belgeler, kalıp ifadeler ("Gereği düşünüldü", "Aşağıdaki karar verilmiştir" vb.) ve biçimsel tekrarlar nedeniyle yüksek oranda benzerlik göstermektedir. MinHash LSH yöntemiyle (num_perm=256, threshold=0.90) benzer belgeler tespit edilerek corpus'tan çıkarılmıştır.

Tablo 2 — Deduplicate Edilmiş Corpus
Alan	İçerik	Belge Sayısı	Boyut (GB)
MEVZUAT	Mevzuat	16.067	0,31
İÇTİHAT	Yerel Hukuk	476.049	4,16
İÇTİHAT	KYB	161	<0,01
HUKUK	Sözlük	2.371	<0,01
İÇTİHAT	İstinaf	193.079	1,84
İÇTİHAT	Yargıtay	7.588.993	14,48
İÇTİHAT	AYM	21.013	0,43
HUKUK DIŞI	Vikipedi	275.203	0,62
HUKUK	Tez	152	0,02
İÇTİHAT	Danıştay	320.330	2,60
HUKUK	Ceza	641	0,03
HUKUK	TBB	1.981	0,09
HUKUK	GSU	381	0,02
TOPLAM		8.896.421	24,60

Veri Dengeleme (Upscale / Downscale)

Upscale/downscale işlemi uygulanarak kaynaklar arası denge kurulmuştur. Yargıtay kararları ~14.5 GB'dan ~3.5 GB'a daraltılırken; makale, tez ve mevzuat kaynakları çoğaltılarak nihai corpus ~19 GB / ~2.3M belge olarak dengelenmiştir.

Tokenizer Eğitimi

Neden Yeni Tokenizer?

Adalet Bakanlığı Hukuk Sözlüğü'nden elde edilen hukuki terimler de dahil edilerek yeni bir tokenizer eğitilmiştir. WordPiece ve Unigram yaklaşımları karşılaştırılmış, Zemberek morfolojik ön-işleme denemeleri yapılmış ve nihai olarak 48K WordPiece tokenizer seçilmiştir.

Tokenizer Karşılaştırması

Tablo 3 — Tokenizer Verimlilik Karşılaştırması (Hukuki Metin Üzerinde)
Tokenizer	Ort. Subword / Satır	Vocab
hukukbert-base-48k-cased	4,82	48.009
hukukbert-base-42k-cased-no-zemberek	4,84	42.020
bert-base-turkish-128k-cased	5,16	128.000
Mursit-Large	5,26	59.008
hukukbert-base-42k-cased-zemberek	5,67	42.020
BERTurk-Legal	5,67	128.000
hukukbert-42k-cased-unigram-v1	6,23	42.102
bert-base-turkish-cased	6,42	32.000
turkish-large-bert-cased	6,42	32.000
TabiBERT	7,38	50.176

Tokenizasyon Örnekleri

Tokenizasyon Karşılaştırması — Hukuki İfadeler
BÖLGE ADLİYE MAHKEMESİ
hukukbert-base-48k-cased ( 3): BÖLGE · ADLİYE · MAHKEMESİ
            bert-base-turkish-128k-cased ( 6): BÖLGE · AD · ##Lİ · ##YE · MAHKEM · ##ESİ
            bert-base-turkish-cased (10): BÖ · ##L · ##GE · AD · ##Lİ · ##YE · MAH · ##K · ##EM · ##ESİ
            turkish-large-bert-cased (10): BÖ · ##L · ##GE · AD · ##Lİ · ##YE · MAH · ##K · ##EM · ##ESİ
            Mursit-Large ( 3): BÃĸLGE · ĠADLÄ°YE · ĠMAHKEMESÄ°
            BERTurk-Legal ( 4): bolg · ##e · adliye · mahkemesi
            TabiBERT (11): B · ÃĸL · GE · ĠA · DL · Ä°YE · ĠM · AH · K · EM · ESÄ°

            Kanun Hükmünde Kararnamenin
hukukbert-base-48k-cased ( 3): Kanun · Hükmünde · Kararnamenin
            bert-base-turkish-128k-cased ( 3): Kanun · Hükmünde · Kararnamenin
            bert-base-turkish-cased ( 4): Kanun · Hükmünde · Kararnam · ##enin
            turkish-large-bert-cased ( 4): Kanun · Hükmünde · Kararnam · ##enin
            Mursit-Large ( 3): Kanun · ĠHÃ¼kmÃ¼nde · ĠKararnamenin
            BERTurk-Legal ( 5): kanun · huk · ##mund · ##e · kararnamenin
            TabiBERT ( 4): KanunĠ · HÃ¼kmÃ¼ndeĠ · Kararnam · enin

            İçtihadı Birleştirme Kararı
hukukbert-base-48k-cased ( 3): İçtihadı · Birleştirme · Kararı
            bert-base-turkish-128k-cased ( 5): İç · ##tihad · ##ı · Birleştirme · Kararı
            bert-base-turkish-cased ( 7): İç · ##tih · ##adı · Birleş · ##tir · ##me · Kararı
            turkish-large-bert-cased ( 7): İç · ##tih · ##adı · Birleş · ##tir · ##me · Kararı
            Mursit-Large ( 4): Ä°Ã§ · tihadÄ± · ĠBirleÅŁtirme · ĠKararÄ±
            BERTurk-Legal ( 5): ictihad · ##ı · birlestir · ##me · kararı
            TabiBERT ( 7): Ä°Ã§ · tih · adÄ±Ġ · Bir · leÅŁtirmeĠ · Kar · arÄ±

            Hukuki Nitelendirme
hukukbert-base-48k-cased ( 2): Hukuki · Nitelendirme
            bert-base-turkish-128k-cased ( 3): Hukuki · Nit · ##elendirme
            bert-base-turkish-cased ( 4): Hukuk · ##i · Nit · ##elendirme
            turkish-large-bert-cased ( 4): Hukuk · ##i · Nit · ##elendirme
            Mursit-Large ( 3): Hukuk · i · ĠNitelendirme
            BERTurk-Legal ( 3): hukuki · nitelendir · ##me
            TabiBERT ( 4): HukukiĠ · Nit · elendir · me
        

Model Eğitimi

Temel Model ve DAPT Stratejisi

Domain-Adaptive Pre-Training (DAPT) yöntem ile ilerlenmiş, tokenizer'ın değişmiş olması model ağırlıklarının yeniden ayarlanmasını gerektirmiştir.

Tablo 4 — Sözlük Örtüşme Analizi
Metrik	Değer
Orjinal Model	128.000 (110.185 bütün kelime · 17.815 continuation)
HukukBERT-48K	48.009 (41.699 bütün kelime · 6.310 continuation)
Paylaşılan token sayısı	36.837
Örtüşme (HukukBERT perspektifi)	76,7%
Örtüşme (Orjinal Model)	28,8%

Tablo 5 — Embedding İlklendirme Raporu
Kategori	Token	%
Birebir eşleşme (exact match)	36.837	76,7
Mean initialization	11.171	23,3
Random initialization	1	<0,1
Toplam	48.009	100,0

İnovatif Maskeleme Stratejileri

20%Whole WordTüm alt tokenlar birlikte maskelenir

30%Word SpanArdışık kelime blokları maskelenir

20%Token SpanArdışık token blokları (SpanBERT)

30%Keyword40.000+ hukuki terim listesinden

Whole Word Masking (WWM): Tek bir kelimenin tüm alt tokenları birlikte maskelenerek modelin bütüncül hukuki kavramları öğrenmesi sağlanmıştır.

Span Masking: SpanBERT'te tanıtılan teknikle ardışık hukuki ifadeler bir bütün olarak maskelenmiştir.

Keyword Masking: 40.000'den fazla hukuki terimden oluşan bir veri seti hazırlanarak maskeleme bütçesinin %30'u bu terimlere ayrılmıştır.

Eğitim Parametreleri

Eğitim, NVIDIA H200 SXM üzerinde toplam 19 saat sürmüştür.

MLM Probability 0.25

Learning Rate 1e-5

Adam β1 / β2 0.9 / 0.98

Batch Size 192

Gradient Accumulation 5

Effective Batch Size 960

Warmup Steps 500

Optimizer AdamW

Scheduler Linear

Epoch 2

Checkpoint Bazında Performans İlerlemesi

Eğitim sürecinde alınan checkpoint'ler aşağıda sunulmuştur:

Tablo 6 — Checkpoint Bazında Performans (N=750)
Checkpoint	Top-1	Top-1 95% CI	Top-3	Top-3 95% CI
checkpoint-22000	84,13%	[81,35% – 86,57%]	98,80%	[97,74% – 99,37%]
checkpoint-21500	84,13%	[81,35% – 86,57%]	98,80%	[97,74% – 99,37%]
checkpoint-20500	84,13%	[81,35% – 86,57%]	98,67%	[97,56% – 99,27%]
checkpoint-20000	84,13%	[81,35% – 86,57%]	98,67%	[97,56% – 99,27%]
checkpoint-29000	83,87%	[81,06% – 86,33%]	98,67%	[97,56% – 99,27%]
checkpoint-28000 (yayınlanan)	83,87%	[81,06% – 86,33%]	98,80%	[97,74% – 99,37%]
checkpoint-26000	83,87%	[81,06% – 86,33%]	98,80%	[97,74% – 99,37%]
Final model	83,60%	[80,78% – 86,08%]	98,93%	[97,91% – 99,46%]
checkpoint-10500	82,53%	[79,65% – 85,08%]	98,40%	[97,22% – 99,08%]
checkpoint-8000	80,67%	[77,69% – 83,33%]	98,00%	[96,73% – 98,78%]
checkpoint-4000	79,07%	[76,01% – 81,83%]	97,73%	[96,40% – 98,58%]

Not: Tam checkpoint listesi için GitHub deposuna başvurabilirsiniz.

Eğitim ve Değerlendirme Grafikleri

HukukBERT eğitim train loss grafiği — Train Loss

HukukBERT değerlendirme loss grafiği — Eval Loss

HukukBERT eğitim gradient norm grafiği — Train Grad Norm

HukukBERT eğitim learning rate grafiği — Train Learning Rate

Değerlendirme Yöntemi: Hukuki Cloze Testi

Model performansını ölçmek için, hukuki kavram tahmine dayalı özel bir cloze test benchmark'ı oluşturulmuştur.

Benchmark veri seti açık kaynak olarak erişilebilir: hukukbert-cloze-benchmark

Örnek — hukukbert_v1_cloze.json
            {
            "id": "bert_cloze_0122",
            "sentence": "Para borcunda gecikme halinde istenebilen yan alacak [MASK]dır.",
            "options": ["yanılma", "müteselsil borçluluk", "faiz", "borcun nakli"],
            "gold": "faiz",
            "metadata": {
            "law_area": "borclar_hukuku",
            "mask_type": "single_token",
            "difficulty": "easy",
            "source": "synthetic_benchmark"
            }
            }
        

Top-1 Accuracy, modelin en yüksek olasılıkla tahmin ettiği seçeneğin doğru cevap olma oranıdır. Top-3 Accuracy ise doğru cevabın ilk üç seçenek arasında bulunma oranını ifade eder. Tüm sonuçlar 750 soruluk test seti üzerinde bootstrap ile hesaplanan %95 güven aralıklarıyla raporlanmıştır. Bu yaklaşım, tekil skorların ötesine geçerek ölçüm belirsizliğini de şeffaf biçimde ortaya koymayı amaçlamaktadır.

Model Performansı — Tüm Modeller

HukukBERT, yalnızca genel amaçlı BERTurk modellerini değil, diğer alan-spesifik Türkçe modelleri de önemli bir farkla geride bırakmıştır:

Tablo 7 — Hukuki Cloze Testi: Tüm Model Karşılaştırması (N=750)
Model	Top-1	Top-1 95% CI	Top-3	Top-3 95% CI
turkhukuk.ai/hukukbert	84,40%	[81,63% – 86,82%]	98,80%	[97,74% – 99,37%]
newmindai/Mursit-Large	78,80%	[75,73% – 81,57%]	97,73%	[96,40% – 98,58%]
KocLab-Bilkent/BERTurk-Legal	75,47%	[72,26% – 78,41%]	96,00%	[94,35% – 97,18%]
dbmdz/bert-base-turkish-128k-cased	71,87%	[68,54% – 74,97%]	95,20%	[93,43% – 96,51%]
boun-tabilab/TabiBERT	68,13%	[64,71% – 71,37%]	95,33%	[93,58% – 96,63%]
dbmdz/bert-base-turkish-cased	63,73%	[60,23% – 67,10%]	93,47%	[91,47% – 95,02%]
ytu-ce-cosmos/turkish-large-bert-cased	61,60%	[58,07% – 65,01%]	91,20%	[88,96% – 93,02%]

Hukuki Cloze Testi Örnekleri

Aşağıdaki örnekler, farklı hukuk alanlarından seçilmiş sorularda tüm modellerin performansını göstermektedir:

Mükerrirlere özgü infaz rejiminin ve cezanın infazından sonra denetimli serbestlik tedbirinin, [MASK], suçu meslek edinen kişi veya örgüt mensubu suçlu hakkında da uygulanmasına hükmedilir.

FAILturkish-large-berttaksirli suçlu (0.30) · tesadüfi suçlu=0.25 · asi suçlu=0.23 · itiyadi suçlu=0.22

FAILMürsit-Largetaksirli suçlu (0.80)

FAILBERTurk-Legaltaksirli suçlu (0.82)

FAILTabiBERTasi suçlu (0.41) · taksirli suçlu=0.36 · tesadüfi suçlu=0.20

FAILBERTurk-casedasi suçlu (0.46) · taksirli suçlu=0.24 · itiyadi suçlu=0.15 · tesadüfi suçlu=0.15

FAILBERTurk-128ktaksirli suçlu (0.69)

WINHukukBERTitiyadi suçlu (0.96) · Vocab: örgüt=0.672, terör=0.056, mükerrir=0.052

Haksız fiillerde maddi veya manevi tazminat istemi, zarar görenin zararı ve tazminat yükümlüsünü öğrendiği tarihten başlayarak [MASK] yılın ve her halde fiilin işlendiği tarihten başlayarak on yılın geçmesiyle zamanaşımına uğrar.

FAILturkish-large-bertbir (0.38) · beş=0.33 · iki=0.21

WINMürsit-Largeiki (0.79)

FAILBERTurk-Legalbir (0.82)

WINTabiBERTiki (0.75)

FAILBERTurk-casedbir (0.54) · iki=0.25 · beş=0.14

WINBERTurk-128kiki (0.68)

WINHukukBERTiki (0.82) · Vocab: iki=0.803, bir=0.130, beş=0.044

Bölge Adliye Mahkemesi kararı tebliğ edildikten sonra yasal [MASK] olan iki haftalık süre geçtikten sonra davalı vekili tarafından temyiz dilekçesi sunulmuştur. 6100 sayılı Hukuk Muhakemeleri Kanunu hükümleri gereğince, süresinden sonra yapılan bu başvurunun usulden reddine karar verilmesi gerekmiştir.

WINturkish-large-bertbaşvuru süresi (0.98)

WINMürsit-Largebaşvuru süresi (0.58) · hak düşürücü süre=0.27

WINBERTurk-Legalbaşvuru süresi (0.65) · hak düşürücü süre=0.35

FAILTabiBERTzamanaşımı süresi (0.69) · başvuru süresi=0.29

WINBERTurk-casedbaşvuru süresi (0.94)

WINBERTurk-128kbaşvuru süresi (0.65) · zamanaşımı süresi=0.32

WINHukukBERTbaşvuru süresi (0.85) · Vocab: temyiz=0.691, başvuru=0.138, süre=0.037

Kişisel verilerin hukuka uygun işlenmesi için ilgili kişinin aydınlatılması, [MASK] yükümlülüğünün bir sonucudur.

WINturkish-large-bertşeffaflık (0.93)

WINMürsit-Largeşeffaflık (0.62) · sözleşmesel=0.37

WINBERTurk-Legalşeffaflık (0.74)

WINTabiBERTşeffaflık (0.96)

WINBERTurk-casedşeffaflık (0.99)

WINBERTurk-128kşeffaflık (0.46) · cezai=0.35 · sözleşmesel=0.18

WINHukukBERTşeffaflık (1.00) · Vocab: aydınlatma=0.962

Takip borcun tamamen ödenmesiyle sona ermişse, icra mahkemesine yapılan şikayet hakkında [MASK] karar verilir.

FAILturkish-large-bertreddi (0.62) · karar verilmesine yer olmadığı=0.32

FAILMürsit-Largereddi (0.47) · karar verilmesine yer olmadığı=0.39 · görevsizlik=0.11

FAILBERTurk-Legalkarar verilmesine yer olmadığı (0.41) · görevsizlik=0.41 · kabulü=0.18

FAILTabiBERTkabulü (0.64)

FAILBERTurk-casedreddi (0.91)

FAILBERTurk-128kgörevsizlik (0.92)

WINHukukBERTkarar verilmesine yer olmadığı (1.00) · Vocab: bir=0.293, da=0.264, mahkemece=0.119

Sözleşmenin kurulması için karşı tarafa yöneltilen irade açıklamasına [MASK] denir.

FAILturkish-large-bertaldatma (0.73)

WINMürsit-Largeicab (0.81)

FAILBERTurk-Legalmüteselsil borçluluk (0.61) · icab=0.23

WINTabiBERTicab (0.52) · aldatma=0.44

FAILBERTurk-casedaldatma (0.85)

WINBERTurk-128kicab (0.60) · aldatma=0.36

WINHukukBERTicab (0.99) · Vocab: icap=0.657, irade=0.176

Sözleşmenin taraflarından birinin, sözleşmede öngörülen edimini ifa etmemesi durumunda, diğer tarafın sahip olduğu hakları kullanabilmesi için borçluya uygun bir [MASK] vermesi veya verdirmesi kural olarak zorunludur.

FAILturkish-large-bertceza (0.48) · tazminat=0.38 · ihtarname=0.14

WINMürsit-Largemehil (0.96)

WINBERTurk-Legalmehil (0.97)

FAILTabiBERTtazminat (0.83)

FAILBERTurk-casedihtarname (0.58) · mehil=0.22

FAILBERTurk-128kceza (0.52) · tazminat=0.29 · mehil=0.16

WINHukukBERTmehil (1.00) · Vocab: mehil=0.807, süre=0.114, önel=0.049

Mirasbırakanın vefatı ile birlikte, mirasçılara kanun gereği bir bütün olarak geçen malvarlığına [MASK] denir.

FAILturkish-large-bertmiras (0.98)

WINMürsit-Largetereke (0.94)

FAILBERTurk-Legalmiras (0.59) · tereke=0.30

FAILTabiBERTmiras (0.95)

FAILBERTurk-casedmiras (0.98)

FAILBERTurk-128kmiras (0.92)

WINHukukBERTtereke (0.96) · Vocab: tereke=0.924, miras=0.037

Aynı amaçla düzenlenen sözleşmelerin metinlerinin özdeş olmaması, bu sözleşmelerde yer alan hükümlerin [MASK] sayılmasına engel teşkil etmez.

FAILturkish-large-bertsözleşme öncesi bildirimler (0.43) · genel işlem koşulu=0.31 · teamül hükümleri=0.16 · tamamlayıcı yorum kuralları=0.10

WINMürsit-Largegenel işlem koşulu (0.53) · teamül hükümleri=0.30 · tamamlayıcı yorum kuralları=0.14

FAILBERTurk-Legalsözleşme öncesi bildirimler (0.61) · teamül hükümleri=0.21

WINTabiBERTgenel işlem koşulu (0.60) · sözleşme öncesi bildirimler=0.23

WINBERTurk-casedgenel işlem koşulu (0.37) · sözleşme öncesi bildirimler=0.36 · tamamlayıcı yorum kuralları=0.19

WINBERTurk-128kgenel işlem koşulu (0.41) · tamamlayıcı yorum kuralları=0.27 · teamül hükümleri=0.20 · sözleşme öncesi bildirimler=0.12

WINHukukBERTgenel işlem koşulu (0.98) · Vocab: aynı=0.136, tek=0.118, de=0.095

İcra mahkemesinin para cezasına ilişkin olmayan nihai kararlarına karşı kural olarak [MASK] kanun yoluna başvurulabilir.

FAILturkish-large-bertitiraz (0.85)

WINMürsit-Largeistinaf (0.84)

FAILBERTurk-Legalitiraz (0.85)

FAILTabiBERTitiraz (0.87)

FAILBERTurk-caseditiraz (0.45) · istinaf=0.30 · karar düzeltme=0.19

WINBERTurk-128kistinaf (0.67)

WINHukukBERTistinaf (0.82) · Vocab: temyiz=0.622, istinaf=0.313, itiraz=0.056

TurkHukuk.ai ekibi olarak, Türkiye'de bu ölçekte ilk kez gerçekleştirilen bu çalışmayla 21 GB temizlenmiş hukuki corpus kullanılarak HukukBERT modeli eğitilmiştir. Model, hem genel amaçlı Türkçe BERT modellerine hem de mevcut alan-spesifik modellere kıyasla hukuki kavram tahmininde kayda değer bir üstünlük sergilemiştir.

HukukBERT, sonraki aşamalarda hukuki NER (Named Entity Recognition), metin segmentasyonu ve semantik arama gibi downstream görevlerde temel model olarak kullanılmaktadır. oluşturmaktır.