Dilbilim kurallarını temel alarak çok dilli metinleri işlemek ve anlam bütünlüğünü korumak için gelişmiş bir tokenizer altyapısı geliştirme.
A simple lexical analyzer tool, written in C++.
A LLM Rag implementation for my girlfriend to study her university courses.
Simple OCR pdf sorter for specific use case.
Dil modeli mimarilerini hızlı bir şekilde prototiplemek, test etmek ve değerlendirmek için geliştirilmiş deneysel araştırma platformu.
This repo is an experimental environment. The goal of this repo is create and train ~50M Language Models and be able to experiment with them using low-resources (both for compute and language data).