Данъчен AI Асистент за 0,05 стотинки на въпрос? Направи си сам и спести 600 лв./година

Данъчен AI Асистент за 0,05 стотинки на въпрос? Направи си сам и спести 600 лв./година

html_content = '''

Данъчен AI Асистент за 0,05 стотинки на въпрос?

Направи си сам и спести 600 лв./година

📅 Април 2026 DIY Технологии Счетоводство

Истината за "данъчните AI асистенти" на пазара

Разгледайте какво предлагат "конкурентите" в България:

План Цена Ограничения
"Бизнес"50 EUR/месец + 10 EUR ДДС= 70,80 лв./месец с ДДС= 849,60 лв./година50 въпроса/месецСамо 25 консултации историяПосочване на законови нормиЕкспорт функция

Нека пресметнем: 70,80 лв. за 50 въпроса = 1,42 лв. на въпрос. За година това е 849,60 лв. - пари, които можете да спестите напълно.

Реалната цена на AI API заявка е между 0,01 и 0,05 лв. в зависимост от модела. Това означава, че доставчиците имат надценка от 2800% до 14200%.

Разкриването: Как работи "магията" зад 50 EUR/месец

Няма магия. Технологията се казва RAG (Retrieval-Augmented Generation) и е напълно достъпна за всеки, който може да следва инструкции. Ето я:

1. Качвате PDF (ЗКПО, ЗДДС, каквото и да е)
2. Системата го нарязва на парчета (chunks)
3. Превръща парчетата във вектори (embedding)
4. Съхранява ги във векторна база (Qdrant)
5. Когато зададете въпрос → търси най-подходящите парчета
6. Подава ги на AI модел (Mistral/DeepSeek) заедно с въпроса
7. Получавате отговор с цитирани източници

Това е всичко. Нищо повече. Няма специален алгоритъм, няма патент, няма "trade secret".

Направи си сам: Пълен технически наръчник

Какво ви трябва

Компонент Безплатно? Цена/месец
VPS сървър (Hetzner CX22)Не~5 EUR
Qdrant (векторна база)Да (open source)0
MariaDB (база данни)Да (open source)0
FastAPI (backend)Да (Python)0
React + Vite (frontend)Да (open source)0
Mistral APIFreemium0,01-0,03 лв./заявка
DeepSeek APIFreemium0,01-0,02 лв./заявка
Sentence TransformerДа (open source)0
DockerДа (open source)0

Общо за инфраструктура

~5 EUR/месец + 0,01-0,05 лв. на въпрос

Стъпка 1: Сървър

Наемете VPS от Hetzner (Германия, GDPR compliant):

  1. CX22 (2 vCPU, 4GB RAM, 40GB SSD) - 4,50 EUR/месец
  2. Или CX32 (4 vCPU, 8GB RAM, 80GB SSD) - 8,50 EUR/месец за повече потребители

Инсталирайте Docker:

# Свежа Ubuntu/Debian инсталация
sudo apt update && sudo apt upgrade -y
curl -fsSL https://get.docker.com -o get-docker.sh
sudo sh get-docker.sh
sudo usermod -aG docker $USER

Стъпка 2: Архитектура на системата

Ето как изглежда пълната архитектура:

┌─────────────────────────────────────────────────┐ │ React Frontend │ │ Чат интерфейс, Управление на документи, │ │ Потребителски профили, Настройки │ │ (TailwindCSS + Vite) │ └────────────────────┬────────────────────────────┘ │ ▼ ┌─────────────────────────────────────────────────┐ │ FastAPI Backend │ │ JWT автентикация, RAG pipeline, │ │ Document processing, Rate limiting │ │ (Python 3.11) │ └──────┬──────────┬──────────┬────────────────────┘ │ │ │ ▼ ▼ ▼ ┌──────────┐ ┌─────────┐ ┌──────────────────┐ │ MariaDB │ │ Qdrant │ │ Mistral/DeepSeek │ │ Потреби- │ │ Векторна│ │ AI API │ │ тели, │ │ база │ │ │ │ разговори│ │ данни │ │ 0,01-0,05 лв. │ │ настройки│ │ │ │ на заявка │ └──────────┘ └─────────┘ └──────────────────┘

Стъпка 3: RAG Pipeline - сърцето на системата

Това е най-важната част. Ето как работи на практика:

3.1 Обработка на документи

# Нарязване на текст на парчета с OVERLAP
# Защо overlap? За да не се губи контекст между парчетата
def chunk_text(text, chunk_size=400, overlap=80):
words = text.split()
chunks = []
step = chunk_size - overlap
for i in range(0, len(words), step):
chunk = ' '.join(words[i:i + chunk_size])
if chunk.strip():
chunks.append(chunk)
if i + chunk_size >= len(words):
break
return chunks

Защо 400 думи с 80 overlap? Законите са дълги текстове. Ако ги нарежем на парчета без застъпване, губим контекст - един член може да бъде разрязан по средата. С 80 думи overlap гарантираме, че всеки chunk има достатъчно контекст.

3.2 Векторизиране (Embedding)

# Използваме paraphrase-multilingual-mpnet-base-v2
# Този модел е специално обучен за многоезичен семантичен анализ
# Размерност: 768 вектора
embedder = SentenceTransformer('paraphrase-multilingual-mpnet-base-v2')

# Всяко парче текст се превръща в 768-мерен вектор
embedding = embedder.encode(chunk).tolist()

3.3 Съхранение в Qdrant

# Qdrant е векторна база данни - съхранява векторите
# и прави бързо семантично търсене
from qdrant_client import QdrantClient
from qdrant_client.models import Distance, VectorParams

client = QdrantClient(host="localhost", port=6333)
client.create_collection(
collection_name="tax_documents",
vectors_config=VectorParams(size=768, distance=Distance.COSINE)
)

3.4 Smart RAG - Интелигентно търсене

Ключовата иновация е двуфазното търсене:

Фаза 1: Широко търсене
├── Търси 80+ chunks с минимален score 0.40-0.45
├── Филтрира само АКТИВНИ документи
└── Групира резултатите по документ

Фаза 2: Прецизно извличане
├── Ранжира документите по: max_score × 0.6 + avg_score × 0.4
├── Вземи топ 3-4 документа
├── От всеки документ - топ 3-4 chunks
└── Проверява token budget (не претоварва AI модела)

Това означава: ако попитате за ЗКПО, системата няма да рови в ЗДДС. Намира САМО релевантните документи.

3.5 Prompt Engineering

Системният prompt е критичен за качеството:

system_prompt = """Ти си експертен счетоводен и данъчен консултант
в България с дългогодишен опит.

Правила за отговор:
1. Винаги отговаряй на български, професионално и ясно.
2. Цитирай конкретни членове и алинеи от законите.
3. Когато даваш примери - реални ставки и суми.
4. Структурирай отговора с секции и списъци.
5. Ако нямаш данни - кажи го ясно.
6. Винаги уточнявай актуалността на информацията.
7. При сложни казуси - стъпка по стъпка.
8. Професионална терминология, но разбираемо."""

А параметрите на генерацията:

payload = {
"model": model,
"temperature": 0.3, # Ниска - за фактични данни
"max_tokens": 4000 # Достатъчно за детайлни отговори
}

Защо temperature 0.3? За данъчни въпроси искаме точност, не креативност. При 0.7 моделът може да "измисли" ставки или членове. При 0.3 отговорите са консистентни и базирани на контекста.

Стъпка 4: Docker Compose - всичко в един файл

version: '3.8'
services:
backend:
build: ./backend
ports:
- "8000:8000"
environment:
- DB_HOST=mariadb
- QDRANT_HOST=qdrant
- JWT_SECRET=your-secret-key
depends_on:
- mariadb
- qdrant

frontend:
build: ./frontend
ports:
- "3000:80"
depends_on:
- backend

mariadb:
image: mariadb:11
environment:
MYSQL_ROOT_PASSWORD: change-me
MYSQL_DATABASE: tax_ai
MYSQL_USER: tax_user
MYSQL_PASSWORD: change-me-too
volumes:
- mariadb_data:/var/lib/mysql

qdrant:
image: qdrant/qdrant:latest
ports:
- "6333:6333"
volumes:
- qdrant_data:/qdrant/storage

volumes:
mariadb_data:
qdrant_data:
docker compose up -d

Това е всичко. Системата работи.

Стъпка 5: Качване на документи

Качете PDF файловете на законите:

Поддържани формати: PDF, TXT, DOCX

Категории:

  1. ЗКПО (Закон за корпоративното подоходно облагане)
  2. ЗДДС (Закон за ДДС)
  3. ЗСч (Закон за счетоводството)
  4. МСС (Международни счетоводни стандарти)
  5. Наредби НАП
  6. Други

Системата автоматично:

  1. Извлича текст от PDF
  2. Нарязва на chunks с overlap
  3. Генерира embeddings
  4. Индексира в Qdrant
  5. Документът е готов за търсене след секунди

Стъпка 6: AI Models - изберете най-доброто за вас

Модел Цена/1K tokens Качество на български Препоръка
Mistral Large~0,03 лв.ОтличноЗа сложни казуси
Mistral Medium~0,01 лв.Много доброЗа ежедневни въпроси
DeepSeek Chat~0,01 лв.ДоброБюджетен вариант
Kimi K2~0,02 лв.ДоброАлтернатива

Реална цена за 50 въпроса/месец:

50 въпроса × ~500 tokens средно × 0,03 лв./1K tokens
= 50 × 0,5 × 0,00003 × 1000
= 0,75 лв./месец за AI API

Инфраструктура: 9,90 лв./месец (Hetzner CX22)

ОБЩО: ~10,65 лв./месец за НЕОГРАНИЧЕН брой въпроси

Сравнете с 70,80 лв./месец за 50 въпроса при конкуренцията.

Стъпка 7: Сигурност

Не пропускайте:

# 1. Генерирайте силни пароли
openssl rand -base64 32 # за JWT_SECRET
openssl rand -base64 24 # за DB пароли

# 2. Firewall
sudo ufw allow 22
sudo ufw allow 80
sudo ufw allow 443
sudo ufw enable

# 3. SSL с Let's Encrypt
sudo apt install certbot python3-certbot-nginx
sudo certbot --nginx -d yourdomain.com

# 4. Fail2ban
sudo apt install fail2ban
sudo systemctl enable fail2ban

Сравнение: DIY vs "Платената алтернатива"

Платена услуга

70,80 лв./месец

  1. ❌ 50 въпроса лимит
  2. ❌ 1,42 лв. на въпрос
  3. ❌ 849,60 лв./година
  4. ❌ 25 разговора история
  5. ❌ Няма контрол на данните

DIY Решение

~10,65 лв./месец

  1. ✅ Неограничени въпроси
  2. ✅ 0,01-0,05 лв. на въпрос
  3. ✅ ~127,80 лв./година
  4. ✅ Неограничена история
  5. ✅ Пълен контрол и GDPR
Характеристика DIY решение 50 EUR/месец
Цена/месец~10,65 лв.70,80 лв.
Цена/година~127,80 лв.849,60 лв.
Брой въпросиНеограничени50
Цена/въпрос0,01-0,05 лв.1,42 лв.
ИсторияНеограничена25 разговора
Контрол на даннитеПъленНулев
GDPRПълен (ваш сървър)Зависи
ПерсонализацияПълнаОграничена
ДокументиВаш изборПредварително зададени
Open sourceДаНе
Спестяване/година721,80 лв.-

Какво подобрихме наскоро

Ако следвате този наръчник, ще получите система с най-новите оптимизации:

По-качествени отговори

Подобрение Преди Сега Полза
System prompt1 изречение8 детайлни правилаПо-професионални отговори
Temperature0.70.3По-точни, без халюцинации
Max tokens15004000По-детайлни отговори
RAG контекст2000 tokens4000 tokensПовече информация за AI
Min relevance score0.55-0.650.40-0.45Намира повече релевантни документи
Документи за анализ2-33-4По-широк поглед
Chunks/документ2-33-4Повече контекст
Търсене limit5080По-задълбочено търсене
Text overlap080 думиБез загуба на контекст

Нови функционалности

  1. Multi-provider AI - Mistral, DeepSeek, Kimi - превключвайте според нуждите
  2. Админ панел - Управление на потребители, настройки, документи
  3. SMTP email - Възстановяване на парола по email
  4. Профили - Смяна на парола, recovery кодове
  5. Архивиране - Деактивиране на стари документи без изтриване
  6. Rate limiting - Защита от превишаване на API лимити

За кого е подходящо

Подходящо за:

  1. Счетоводни фирми, които искат да спестят
  2. IT-грамотни счетоводители
  3. Софтуерни инженери в счетоводната сфера
  4. Фирми с вътрешен IT отдел
  5. Всеки, който не иска да плаща 700% надценка

НЕ е подходящо за:

  1. Фирми без технически персонал (но може да наемете фрийлансър за 1-2 дни setup)
  2. Тези, които предпочитат "plug and play" (но на 70 лв./месец разлика...)

Често задавани въпроси

В: Трябва ли ми програмист?

О: Базовият setup може да се направи от всеки, който може да следва инструкции. За персонализации - да, един Python/React разработчик за 1-2 дни.

В: Какво става ако сървърът падне?

О: С Docker restart политиката контейнерите се вдигат автоматично. При daily backups имате пълна защита.

В: Може ли да се ползва за други езици?

О: Да, системата е multilingual. Може да се адаптира за румънско, гръцко, сръбско законодателство.

В: Как се обновяват законите?

О: Просто качвате новия PDF през интерфейса. Старият може да се архивира или изтрие.

В: Хората наистина ли плащат 50 EUR/месец за това?

О: Да. И получават само 50 въпроса. При 0,05 лв. на въпрос, това е надценка от 2800%.

Заключение

Данъчният AI асистент не е ракетна наука. Той е:

  1. PDF качване - качвате законите
  2. Embedding - системата ги разбира
  3. Vector search - намира релевантното
  4. LLM call - генерира отговор
  5. Цитати - посочва източниците

Цената? 0,01-0,05 лв. на въпрос плюс ~10 лв./месец за сървър. Не 70,80 лв./месец за 50 въпроса.

Ако сте счетоводна фирма с 5 служители, правите ~200 въпроса/месец:

DIY: 200 × 0,05 + 10 лв. сървър = 20 лв./месец = 240 лв./година
Платено: 4 плана × 70,80 лв. = 283,20 лв./месец = 3 398,40 лв./година

Спестяване: 3 158,40 лв./година

Изборът е ваш.

Технически Stack (за любопитните)

Frontend: React 18 + Vite + TailwindCSS + Nginx
Backend: Python 3.11 + FastAPI + Pydantic
AI: Mistral Large / DeepSeek Chat / Kimi K2
Embedding: paraphrase-multilingual-mpnet-base-v2 (768d)
Vector DB: Qdrant (cosine similarity)
Database: MariaDB 11
Infra: Docker Compose + Hetzner VPS
Security: JWT + bcrypt + UFW + Fail2ban + SSL

#AI #RAG #TaxTech #OpenSource #DIY #Счетоводство #България #Mistral #DeepSeek #Qdrant #FastAPI

Статията отразява реални цени и технологии, актуални към Април 2026. Всички компоненти са open source и свободно достъпни.

''' # Save the HTML file with open('/mnt/kimi/output/danen-asistent.html', 'w', encoding='utf-8') as f: f.write(html_content) print("HTML файлът е създаден успешно!") print("Локация: /mnt/kimi/output/danen-asistent.html")

← Назад към всички статии