Проекты

Меня зовут Олег Рахимов (R1HIM). Здесь — мои проекты, материалы (видео/скриншоты/PDF) и контакты.

Приложение для релакса и ambience: сцены (видео-фоны), встроенный музыкальный плеер и таймер сессии.

Google PlayMedia playbackSession timerUI/UX

Приложение для учёта рабочих смен: календарь, история, расчёт часов и калькуляторы, связанные с оплатой.

KotlinJetpack ComposeMVVMCoroutinesFlow

PDF (описание) PDF (EN)

Экосистема для управления заявками и плановым обслуживанием в офисном здании: прозрачность процессов для арендаторов, техников и администратора.

QR navigationRequest workflowPhoto/Video evidencePDF protocolsNotifications

PDF (EN)

Self-hosted прототип для почти-реального времени перевода веб-созвонов (Google Meet / Zoom Web / Teams Web).

Chrome/Edge Extension (MV3)Java 21 Local BridgeOpenAI STT & TTSlocalhost token

Ключ OpenAI не хранится в расширении: все запросы идут через localhost bridge-сервис, защищённый токеном.

Подробнее

Ключевая идея

Технологический стек

Extension: JavaScript/HTML/CSS, Chrome Extensions MV3 (tabCapture, getUserMedia, offscreen, content_script).
Local Bridge: Java 21, HttpServer/HttpClient (JDK), Jackson, Maven (shade-plugin), запуск PowerShell/Batch.

Входящий перевод (субтитры)

tabCapture → MediaRecorder чанки (OGG/Opus предпочтительно).
POST /transcribe-and-translate → OpenAI STT (whisper-1) → перевод через /v1/responses (gpt-4o-mini, temperature=0).
Отображение перевода поверх страницы звонка (content_script overlay).

Исходящий голосовой перевод (TTS)

getUserMedia микрофона → чанки → распознавание/перевод.
POST /tts → OpenAI TTS (/v1/audio/speech, gpt-4o-mini-tts, mp3).
Воспроизведение в виртуальный аудиокабель (например VB-Audio Virtual Cable), чтобы Meet использовал это как микрофон.

Защиты

Локальный API (127.0.0.1)

Требуется X-Auth-Token == LOCAL_MEET_TRANSLATOR_TOKEN.
GET /health, POST /translate-text, POST /transcribe-and-translate, POST /tts (ENABLE_TTS=true).

Конфигурация (env)