html_content = '''

Данъчен AI Асистент за 0,05 стотинки на въпрос?

Направи си сам и спести 600 лв./година

📅 Април 2026 DIY Технологии Счетоводство

Истината за "данъчните AI асистенти" на пазара

Разгледайте какво предлагат "конкурентите" в България:

План Цена Ограничения
"Бизнес"	50 EUR/месец + 10 EUR ДДС	= 70,80 лв./месец с ДДС	= 849,60 лв./година	50 въпроса/месец	Само 25 консултации история	Посочване на законови норми	Експорт функция

Нека пресметнем: 70,80 лв. за 50 въпроса = 1,42 лв. на въпрос. За година това е 849,60 лв. - пари, които можете да спестите напълно.

Реалната цена на AI API заявка е между 0,01 и 0,05 лв. в зависимост от модела. Това означава, че доставчиците имат надценка от 2800% до 14200%.

Разкриването: Как работи "магията" зад 50 EUR/месец

Няма магия. Технологията се казва RAG (Retrieval-Augmented Generation) и е напълно достъпна за всеки, който може да следва инструкции. Ето я:

1. Качвате PDF (ЗКПО, ЗДДС, каквото и да е)

2. Системата го нарязва на парчета (chunks)

3. Превръща парчетата във вектори (embedding)

4. Съхранява ги във векторна база (Qdrant)

5. Когато зададете въпрос → търси най-подходящите парчета

6. Подава ги на AI модел (Mistral/DeepSeek) заедно с въпроса

7. Получавате отговор с цитирани източници

Това е всичко. Нищо повече. Няма специален алгоритъм, няма патент, няма "trade secret".

Направи си сам: Пълен технически наръчник

Какво ви трябва

Компонент Безплатно? Цена/месец
VPS сървър (Hetzner CX22)	Не	~5 EUR
Qdrant (векторна база)	Да (open source)	0
MariaDB (база данни)	Да (open source)	0
FastAPI (backend)	Да (Python)	0
React + Vite (frontend)	Да (open source)	0
Mistral API	Freemium	0,01-0,03 лв./заявка
DeepSeek API	Freemium	0,01-0,02 лв./заявка
Sentence Transformer	Да (open source)	0
Docker	Да (open source)	0

Общо за инфраструктура

~5 EUR/месец + 0,01-0,05 лв. на въпрос

Стъпка 1: Сървър

Наемете VPS от Hetzner (Германия, GDPR compliant):

CX22 (2 vCPU, 4GB RAM, 40GB SSD) - 4,50 EUR/месец
Или CX32 (4 vCPU, 8GB RAM, 80GB SSD) - 8,50 EUR/месец за повече потребители

Инсталирайте Docker:

# Свежа Ubuntu/Debian инсталация

sudo apt update && sudo apt upgrade -y

curl -fsSL https://get.docker.com -o get-docker.sh

sudo sh get-docker.sh

sudo usermod -aG docker $USER

Стъпка 2: Архитектура на системата

Ето как изглежда пълната архитектура:

┌─────────────────────────────────────────────────┐ │ React Frontend │ │ Чат интерфейс, Управление на документи, │ │ Потребителски профили, Настройки │ │ (TailwindCSS + Vite) │ └────────────────────┬────────────────────────────┘ │ ▼ ┌─────────────────────────────────────────────────┐ │ FastAPI Backend │ │ JWT автентикация, RAG pipeline, │ │ Document processing, Rate limiting │ │ (Python 3.11) │ └──────┬──────────┬──────────┬────────────────────┘ │ │ │ ▼ ▼ ▼ ┌──────────┐ ┌─────────┐ ┌──────────────────┐ │ MariaDB │ │ Qdrant │ │ Mistral/DeepSeek │ │ Потреби- │ │ Векторна│ │ AI API │ │ тели, │ │ база │ │ │ │ разговори│ │ данни │ │ 0,01-0,05 лв. │ │ настройки│ │ │ │ на заявка │ └──────────┘ └─────────┘ └──────────────────┘

Стъпка 3: RAG Pipeline - сърцето на системата

Това е най-важната част. Ето как работи на практика:

3.1 Обработка на документи

# Нарязване на текст на парчета с OVERLAP

# Защо overlap? За да не се губи контекст между парчетата

def chunk_text(text, chunk_size=400, overlap=80):

words = text.split()

chunks = []

step = chunk_size - overlap

for i in range(0, len(words), step):

chunk = ' '.join(words[i:i + chunk_size])

if chunk.strip():

chunks.append(chunk)

if i + chunk_size >= len(words):

break

return chunks

Защо 400 думи с 80 overlap? Законите са дълги текстове. Ако ги нарежем на парчета без застъпване, губим контекст - един член може да бъде разрязан по средата. С 80 думи overlap гарантираме, че всеки chunk има достатъчно контекст.

3.2 Векторизиране (Embedding)

# Използваме paraphrase-multilingual-mpnet-base-v2

# Този модел е специално обучен за многоезичен семантичен анализ

# Размерност: 768 вектора

embedder = SentenceTransformer('paraphrase-multilingual-mpnet-base-v2')

# Всяко парче текст се превръща в 768-мерен вектор

embedding = embedder.encode(chunk).tolist()

3.3 Съхранение в Qdrant

# Qdrant е векторна база данни - съхранява векторите

# и прави бързо семантично търсене

from qdrant_client import QdrantClient

from qdrant_client.models import Distance, VectorParams

client = QdrantClient(host="localhost", port=6333)

client.create_collection(

collection_name="tax_documents",

vectors_config=VectorParams(size=768, distance=Distance.COSINE)

)

3.4 Smart RAG - Интелигентно търсене

Ключовата иновация е двуфазното търсене:

Фаза 1: Широко търсене

├── Търси 80+ chunks с минимален score 0.40-0.45

├── Филтрира само АКТИВНИ документи

└── Групира резултатите по документ

Фаза 2: Прецизно извличане

├── Ранжира документите по: max_score × 0.6 + avg_score × 0.4

├── Вземи топ 3-4 документа

├── От всеки документ - топ 3-4 chunks

└── Проверява token budget (не претоварва AI модела)

Това означава: ако попитате за ЗКПО, системата няма да рови в ЗДДС. Намира САМО релевантните документи.

3.5 Prompt Engineering

Системният prompt е критичен за качеството:

system_prompt = """Ти си експертен счетоводен и данъчен консултант

в България с дългогодишен опит.

Правила за отговор:

1. Винаги отговаряй на български, професионално и ясно.

2. Цитирай конкретни членове и алинеи от законите.

3. Когато даваш примери - реални ставки и суми.

4. Структурирай отговора с секции и списъци.

5. Ако нямаш данни - кажи го ясно.

6. Винаги уточнявай актуалността на информацията.

7. При сложни казуси - стъпка по стъпка.

8. Професионална терминология, но разбираемо."""

А параметрите на генерацията:

payload = {

"model": model,

"temperature": 0.3, # Ниска - за фактични данни

"max_tokens": 4000 # Достатъчно за детайлни отговори

}

Защо temperature 0.3? За данъчни въпроси искаме точност, не креативност. При 0.7 моделът може да "измисли" ставки или членове. При 0.3 отговорите са консистентни и базирани на контекста.

Стъпка 4: Docker Compose - всичко в един файл

version: '3.8'

services:

backend:

build: ./backend

ports:

- "8000:8000"

environment:

- DB_HOST=mariadb

- QDRANT_HOST=qdrant

- JWT_SECRET=your-secret-key

depends_on:

- mariadb

- qdrant

frontend:

build: ./frontend

ports:

- "3000:80"

depends_on:

- backend

mariadb:

image: mariadb:11

environment:

MYSQL_ROOT_PASSWORD: change-me

MYSQL_DATABASE: tax_ai

MYSQL_USER: tax_user

MYSQL_PASSWORD: change-me-too

volumes:

- mariadb_data:/var/lib/mysql

qdrant:

image: qdrant/qdrant:latest

ports:

- "6333:6333"

volumes:

- qdrant_data:/qdrant/storage

volumes:

mariadb_data:

qdrant_data:

docker compose up -d

Това е всичко. Системата работи.

Стъпка 5: Качване на документи

Качете PDF файловете на законите:

Поддържани формати: PDF, TXT, DOCX

Категории:

ЗКПО (Закон за корпоративното подоходно облагане)
ЗДДС (Закон за ДДС)
ЗСч (Закон за счетоводството)
МСС (Международни счетоводни стандарти)
Наредби НАП
Други

Системата автоматично:

Извлича текст от PDF
Нарязва на chunks с overlap
Генерира embeddings
Индексира в Qdrant
Документът е готов за търсене след секунди

Стъпка 6: AI Models - изберете най-доброто за вас

Модел Цена/1K tokens Качество на български Препоръка
Mistral Large	~0,03 лв.	Отлично	За сложни казуси
Mistral Medium	~0,01 лв.	Много добро	За ежедневни въпроси
DeepSeek Chat	~0,01 лв.	Добро	Бюджетен вариант
Kimi K2	~0,02 лв.	Добро	Алтернатива

Реална цена за 50 въпроса/месец:

50 въпроса × ~500 tokens средно × 0,03 лв./1K tokens

= 50 × 0,5 × 0,00003 × 1000

= 0,75 лв./месец за AI API

Инфраструктура: 9,90 лв./месец (Hetzner CX22)

ОБЩО: ~10,65 лв./месец за НЕОГРАНИЧЕН брой въпроси

Сравнете с 70,80 лв./месец за 50 въпроса при конкуренцията.

Стъпка 7: Сигурност

Не пропускайте:

# 1. Генерирайте силни пароли

openssl rand -base64 32 # за JWT_SECRET

openssl rand -base64 24 # за DB пароли

# 2. Firewall

sudo ufw allow 22

sudo ufw allow 80

sudo ufw allow 443

sudo ufw enable

# 3. SSL с Let's Encrypt

sudo apt install certbot python3-certbot-nginx

sudo certbot --nginx -d yourdomain.com

# 4. Fail2ban

sudo apt install fail2ban

sudo systemctl enable fail2ban

Сравнение: DIY vs "Платената алтернатива"

Платена услуга

70,80 лв./месец

❌ 50 въпроса лимит
❌ 1,42 лв. на въпрос
❌ 849,60 лв./година
❌ 25 разговора история
❌ Няма контрол на данните

DIY Решение

~10,65 лв./месец

✅ Неограничени въпроси
✅ 0,01-0,05 лв. на въпрос
✅ ~127,80 лв./година
✅ Неограничена история
✅ Пълен контрол и GDPR

Характеристика DIY решение 50 EUR/месец
Цена/месец	~10,65 лв.	70,80 лв.
Цена/година	~127,80 лв.	849,60 лв.
Брой въпроси	Неограничени	50
Цена/въпрос	0,01-0,05 лв.	1,42 лв.
История	Неограничена	25 разговора
Контрол на данните	Пълен	Нулев
GDPR	Пълен (ваш сървър)	Зависи
Персонализация	Пълна	Ограничена
Документи	Ваш избор	Предварително зададени
Open source	Да	Не
Спестяване/година	721,80 лв.	-

Какво подобрихме наскоро

Ако следвате този наръчник, ще получите система с най-новите оптимизации:

По-качествени отговори

Подобрение Преди Сега Полза
System prompt	1 изречение	8 детайлни правила	По-професионални отговори
Temperature	0.7	0.3	По-точни, без халюцинации
Max tokens	1500	4000	По-детайлни отговори
RAG контекст	2000 tokens	4000 tokens	Повече информация за AI
Min relevance score	0.55-0.65	0.40-0.45	Намира повече релевантни документи
Документи за анализ	2-3	3-4	По-широк поглед
Chunks/документ	2-3	3-4	Повече контекст
Търсене limit	50	80	По-задълбочено търсене
Text overlap	0	80 думи	Без загуба на контекст

Нови функционалности

Multi-provider AI - Mistral, DeepSeek, Kimi - превключвайте според нуждите
Админ панел - Управление на потребители, настройки, документи
SMTP email - Възстановяване на парола по email
Профили - Смяна на парола, recovery кодове
Архивиране - Деактивиране на стари документи без изтриване
Rate limiting - Защита от превишаване на API лимити

За кого е подходящо

Подходящо за:

Счетоводни фирми, които искат да спестят
IT-грамотни счетоводители
Софтуерни инженери в счетоводната сфера
Фирми с вътрешен IT отдел
Всеки, който не иска да плаща 700% надценка

НЕ е подходящо за:

Фирми без технически персонал (но може да наемете фрийлансър за 1-2 дни setup)
Тези, които предпочитат "plug and play" (но на 70 лв./месец разлика...)

Често задавани въпроси

В: Трябва ли ми програмист?

О: Базовият setup може да се направи от всеки, който може да следва инструкции. За персонализации - да, един Python/React разработчик за 1-2 дни.

В: Какво става ако сървърът падне?

О: С Docker restart политиката контейнерите се вдигат автоматично. При daily backups имате пълна защита.

В: Може ли да се ползва за други езици?

О: Да, системата е multilingual. Може да се адаптира за румънско, гръцко, сръбско законодателство.

В: Как се обновяват законите?

О: Просто качвате новия PDF през интерфейса. Старият може да се архивира или изтрие.

В: Хората наистина ли плащат 50 EUR/месец за това?

О: Да. И получават само 50 въпроса. При 0,05 лв. на въпрос, това е надценка от 2800%.

Заключение

Данъчният AI асистент не е ракетна наука. Той е:

PDF качване - качвате законите
Embedding - системата ги разбира
Vector search - намира релевантното
LLM call - генерира отговор
Цитати - посочва източниците

Цената? 0,01-0,05 лв. на въпрос плюс ~10 лв./месец за сървър. Не 70,80 лв./месец за 50 въпроса.

Ако сте счетоводна фирма с 5 служители, правите ~200 въпроса/месец:

DIY: 200 × 0,05 + 10 лв. сървър = 20 лв./месец = 240 лв./година

Платено: 4 плана × 70,80 лв. = 283,20 лв./месец = 3 398,40 лв./година

Спестяване: 3 158,40 лв./година

Изборът е ваш.

Технически Stack (за любопитните)

Frontend: React 18 + Vite + TailwindCSS + Nginx

Backend: Python 3.11 + FastAPI + Pydantic

AI: Mistral Large / DeepSeek Chat / Kimi K2

Embedding: paraphrase-multilingual-mpnet-base-v2 (768d)

Vector DB: Qdrant (cosine similarity)

Database: MariaDB 11

Infra: Docker Compose + Hetzner VPS

Security: JWT + bcrypt + UFW + Fail2ban + SSL

#AI #RAG #TaxTech #OpenSource #DIY #Счетоводство #България #Mistral #DeepSeek #Qdrant #FastAPI

Статията отразява реални цени и технологии, актуални към Април 2026. Всички компоненти са open source и свободно достъпни.

''' # Save the HTML file with open('/mnt/kimi/output/danen-asistent.html', 'w', encoding='utf-8') as f: f.write(html_content) print("HTML файлът е създаден успешно!") print("Локация: /mnt/kimi/output/danen-asistent.html")