Закупки подпроектов
18 июля 2024г.
НАО «Восточно-Казахстанский технический университет имени Д. Серикбаева» в рамках подпроекта №67245 «Разработка ИИ-систем для горно-металлургической отрасли» приглашает потенциальных поставщиков представить ценовое предложение по форме заявки на поставку:
№67245/G/SH-03 Оборудование для сбора данных
Крайний срок для представления Вашего ценового предложения: 18 часов 00 минут 25 июля 2024г.
18 июля 2024г.
НАО «Восточно-Казахстанский технический университет имени Д. Серикбаева» в рамках подпроекта №67245 «Разработка ИИ-систем для горно-металлургической отрасли» приглашает потенциальных поставщиков представить ценовое предложение по форме заявки на поставку:
№67245/G/SH-02 Пакет оборудования 1 (Обработка и визуализация)»
Крайний срок для представления Вашего ценового предложения: 18 часов 00 минут 25 июля 2024г.
18 июля 2024г.
НАО «Восточно-Казахстанский технический университет имени Д. Серикбаева» в рамках подпроекта №67245 «Разработка ИИ-систем для горно-металлургической отрасли» приглашает потенциальных поставщиков представить ценовое предложение по форме заявки на поставку:
№67245/G/SH-01 «Пакет оборудования (сетевое оборудование)»
Крайний срок для представления Вашего ценового предложения: 18 часов 00 минут 25 июля 2024г.
17 июля 2024г.
ТОО «АбАз» в рамках проекта № 62124 «Доступное для всех онлайн образование с oilan-classroom.com» приглашает потенциальных претендентов выразить свою заинтересованность в конкурсе:
Вакансия: Главный менеджер Подпроекта.
Крайний срок до 18 часов 00 минут 24 июля 2024 года
16 июля 2024 года
РЕСПУБЛИКА КАЗАХСТАН
ПРОЕКТ «СТИМУЛИРОВАНИЕ ПРОДУКТИВНЫХ ИННОВАЦИЙ»
Название подпроекта: №78925 «Разработка искусственного интеллекта на основе Большой Языковой Модели для казахского языка».
Источник финансирования: Грант (Соглашение о Гранте №9 от “20” июня 2024 г.).
Наименование закупки в соответствии с планом закупок: 78925/S/CQS-03 Услуги по очистке текстовых данных (словоупотреблений) на казахском языке, токенизация и нормализация данных
Кому: Всем заинтересованным лицам (потенциальным поставщикам).
ЗАПРОС НА ВЫРАЖЕНИЕ ЗАИНТЕРЕСОВАННОСТИ
Республиканское государственное предприятие на праве хозяйственного ведения «Центр поддержки цифрового правительства» Министерства цифрового развития, инноваций и аэрокосмической промышленности Республики Казахстан приглашает выразить заинтересованность оказать «Услуги по очистке текстовых данных (словоупотреблений) на казахском языке, токенизация и нормализация данных»
Цель
В ходе реализации Подпроекта предполагается создание корпуса текстов на казахском языке для обучения Больших языковых моделей. Заказчик приобретает услуги по сбору текстовых данных (словоупотреблений) на казахском языке с репрезентативным содержанием и с широким охватом разнообразных сфер жизни.
Цель услуги – очистка, токенизация и нормализация текстовых данных на казахском языке для обучения большой языковой модели (LLM).
Для обеспечения качества данных и их соответствия техническим требованиям, предъявляемым к данным для Больших языковых моделей необходимо, чтобы филологи и IT специалисты работали в тесном сотрудничестве для настройки инструментов обработки данных в соответствии с согласованной методологией.
Ожидаемая продолжительность задания
Продолжительность: 3 месяца (продолжительность задания может быть изменена в зависимости от процедур закупок и подписания контракта) с даты подписания контракта.
Объем услуг
Минимум 1 миллиард словоупотреблений.
Описать исходные данные. Определить и согласовать с Заказчиком правила обработки текстов, выделения языковых конструкций.
Удаление дубликатов
Определить и согласовать с Заказчиком правила определения дубликатов
Определить и удалить дублирующиеся записи в данных.
Удаление нежелательного контента
Определить и согласовать с Заказчиком правила определения нежелательного контента
Удалить не относящиеся к теме фрагменты текста, такие как спам, реклама, ненормативная лексика.
Обработка специальных символов
Удалить или заменить специальные символы (эмодзи, HTML-теги и т.д.) в тексте.
Исправление ошибок
Обнаружить и исправить орфографические и грамматические ошибки.
Промежуточные отчеты
Ежемесячно в последний рабочий день отчетного месяца предоставлять отчеты о ходе выполнения работ, включая выявленные проблемы и предложения по их решению.
Содержание отчетов:
- Текущий статус выполнения работ: Описание текущего состояния проекта, указание на выполненные задачи и достигнутые этапы.
- Обнаруженные проблемы: Перечисление всех проблем, возникших в ходе выполнения работ, с подробным описанием каждой проблемы.
- Способы решения: Описание предпринимаемых мер для решения обнаруженных проблем, включая примененные методики, используемые инструменты и достигнутые результаты.
- План на следующий период: Подробное описание задач и целей на следующий отчетный период, с указанием ожидаемых результатов.
- Изменения в планах: Описание любых изменений в первоначальных планах, причин этих изменений и их влияние на общий график проекта.
- Риски: Описание возможных рисков, связанных с проектом, и меры по их минимизации.
- Ресурсы: Обзор использования ресурсов, включая время, людей и технические средства.
Итоговый отчет
Представить итоговый отчет 7 октября 2024 года. Отчет должен включать обзор проделанной работы, анализ полученных результатов и рекомендации.
Обзор проделанной работы:
- Методология: Описание использованных методов и подходов для выполнения задач по очистке данных, токенизации и нормализации.
- Процесс выполнения: Детальное описание процесса выполнения каждой стадии работы, включая удаление дубликатов, нежелательного контента, обработку специальных символов, исправление ошибок, токенизацию и нормализацию данных.
«Центр поддержки цифрового правительства» теперь приглашает соответствующие требованиям компании выразить свою заинтересованность в выполнении этого задания. Заинтересованные компании должны предоставить информацию, указывающую на их квалификацию для выполнения услуг (брошюры, опыт внедрения и описание аналогичных заданий, наличие соответствующего квалифицированного персонала и т.д.). Критерии отбора компаний в короткий список, следующие:
Консультант в форме юридического лица или консорциума юридических лиц должен соответствовать следующим квалификационным требованиям для оказания услуг по Контракту:
- наличие 3 летнего опыта в создании и разработке качественного аудио, видео и текстового контента на казахском языке и их популяризации).
Наличие команды из филологов и высококвалифицированных IT специалистов, соответствующим к следующим критериям:
№ |
Квалификация |
Количество |
1 |
Специалист с высшим профессиональным образованием в области ИТ/ИКТ и/или инженерии (машинное обучение, большие данные, дата-аналитика, администрирование баз данных, искусственный интеллект) |
10 |
2 |
Специалист со степенью PhD в области филологии казахского языка |
1 |
3 |
Специалист с ученой степенью кандидата наук в области филологии казахского языка |
2 |
4 |
Специалист с ученым званием ассоциированного профессора (доцента) в области филологии казахского языка |
1 |
Преимуществом будет:
- доказанный опыт работы с библиотеками машинного обучения (например, TensorFlow, PyTorch, Keras, Scikit-learn);
- Профессиональная cертификация или подтверждение прохождения курсов в сфере оказываемой услуги
Внимание заинтересованных компаний обращается на пункт 1.9 Руководства Всемирного банка "Отбор и наем консультантов заемщиками Всемирного банка" (редакция от января 2011 г., редакции от июля 2014 г.), в котором излагается политика Всемирного банка в отношении конфликта интересов.
Компании могут объединяться для повышения своей квалификации.
Компания будет выбрана с использованием метода отбора, основанного на квалификации Консультанта, в соответствии с процедурами, изложенными в Руководстве Всемирного банка "Отбор и наем консультантов заемщиками Всемирного банка" (редакция от января 2011 г., редакции от июля 2014 г.).
Все заинтересованные компании могут отправить свои заявления о заинтересованности, подписанные уполномоченным лицом, в формате PDF по электронной почте: Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра. (обязательная копия Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.) или пришлите по указанному ниже адресу до крайнего срока 18:00 30 июля 2024 года (времени Астаны)
Биғари Рүстем Айдарбекұлы – Руководитель подпроекта «Разработка искусственного интеллекта на основе Большой Языковой Модели для казахского языка».
Почтовый адрес: г. Астана, район Есиль, проспект Мәңгілік Ел, 55/5, блок С 2.4, кабинет 3.03.
Почтовый индекс: 010000.
Телефон: ++7 7172 735297.
Адрес электронной почты: Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.