Закупки подпроектов

18 июля 2024г.

НАО «Восточно-Казахстанский технический университет имени Д. Серикбаева» в рамках подпроекта №67245 «Разработка ИИ-систем для горно-металлургической отрасли» приглашает потенциальных поставщиков представить ценовое предложение по форме заявки на поставку: 

№67245/G/SH-03 Оборудование для сбора данных

Крайний срок для представления Вашего ценового предложения: 18 часов 00 минут 25 июля 2024г.

Подробнее ЗЦП

Форма заявки Word

18 июля 2024г.

НАО «Восточно-Казахстанский технический университет имени Д. Серикбаева» в рамках подпроекта №67245 «Разработка ИИ-систем для горно-металлургической отрасли» приглашает потенциальных поставщиков представить ценовое предложение по форме заявки на поставку: 

№67245/G/SH-02 Пакет оборудования 1 (Обработка и визуализация)»

Крайний срок для представления Вашего ценового предложения: 18 часов 00 минут 25 июля 2024г.

Подробнее ЗЦП

Форма заявки Word

18 июля 2024г.

НАО «Восточно-Казахстанский технический университет имени Д. Серикбаева» в рамках подпроекта №67245 «Разработка ИИ-систем для горно-металлургической отрасли» приглашает потенциальных поставщиков представить ценовое предложение по форме заявки на поставку: 

№67245/G/SH-01 «Пакет оборудования (сетевое оборудование)»

Крайний срок для представления Вашего ценового предложения: 18 часов 00 минут 25 июля 2024г.

Подробнее ЗЦП

Форма заявки Word

17 июля 2024г.

ТОО «АбАз» в рамках проекта № 62124  «Доступное для всех онлайн образование с oilan-classroom.com» приглашает потенциальных претендентов выразить свою заинтересованность в конкурсе:

Вакансия: Главный менеджер Подпроекта.

Крайний срок до 18 часов 00 минут 24 июля 2024 года

Подробнее

16 июля 2024 года

РЕСПУБЛИКА КАЗАХСТАН

ПРОЕКТ «СТИМУЛИРОВАНИЕ ПРОДУКТИВНЫХ ИННОВАЦИЙ»

 

Название подпроекта: №78925 «Разработка искусственного интеллекта на основе Большой Языковой Модели для казахского языка».

Источник финансирования: Грант (Соглашение о Гранте №9 от “20” июня 2024 г.).

 

Наименование закупки в соответствии с планом закупок: 78925/S/CQS-03 Услуги по очистке текстовых данных (словоупотреблений) на казахском языке, токенизация и нормализация данных

Кому: Всем заинтересованным лицам (потенциальным поставщикам).

 

                        ЗАПРОС НА ВЫРАЖЕНИЕ ЗАИНТЕРЕСОВАННОСТИ

 

Республиканское государственное предприятие на праве хозяйственного ведения «Центр поддержки цифрового правительства» Министерства цифрового развития, инноваций и аэрокосмической промышленности Республики Казахстан приглашает выразить заинтересованность оказать «Услуги по очистке текстовых данных (словоупотреблений) на казахском языке, токенизация и нормализация данных»

Цель

В ходе реализации Подпроекта предполагается создание корпуса текстов на казахском языке для обучения Больших языковых моделей. Заказчик приобретает услуги по сбору текстовых данных (словоупотреблений) на казахском языке с репрезентативным содержанием и с широким охватом разнообразных сфер жизни.

Цель услуги – очистка, токенизация и нормализация текстовых данных на казахском языке для обучения большой языковой модели (LLM).

Для обеспечения качества данных и их соответствия техническим требованиям, предъявляемым к данным для Больших языковых моделей необходимо, чтобы филологи и IT специалисты работали в тесном сотрудничестве для настройки инструментов обработки данных в соответствии с согласованной методологией.

 

Ожидаемая продолжительность задания

Продолжительность: 3 месяца (продолжительность задания может быть изменена в зависимости от процедур закупок и подписания контракта) с даты подписания контракта.

Объем услуг

Минимум 1 миллиард словоупотреблений.

Описать исходные данные. Определить и согласовать с Заказчиком правила обработки текстов, выделения языковых конструкций.

Удаление дубликатов

Определить и согласовать с Заказчиком правила определения дубликатов

Определить и удалить дублирующиеся записи в данных.

Удаление нежелательного контента

Определить и согласовать с Заказчиком правила определения нежелательного контента

Удалить не относящиеся к теме фрагменты текста, такие как спам, реклама, ненормативная лексика.

Обработка специальных символов

Удалить или заменить специальные символы (эмодзи, HTML-теги и т.д.) в тексте.

Исправление ошибок

Обнаружить и исправить орфографические и грамматические ошибки.

 

Промежуточные отчеты

Ежемесячно в последний рабочий день отчетного месяца предоставлять отчеты о ходе выполнения работ, включая выявленные проблемы и предложения по их решению.

Содержание отчетов:

  • Текущий статус выполнения работ: Описание текущего состояния проекта, указание на выполненные задачи и достигнутые этапы.
  • Обнаруженные проблемы: Перечисление всех проблем, возникших в ходе выполнения работ, с подробным описанием каждой проблемы.
  • Способы решения: Описание предпринимаемых мер для решения обнаруженных проблем, включая примененные методики, используемые инструменты и достигнутые результаты.
  • План на следующий период: Подробное описание задач и целей на следующий отчетный период, с указанием ожидаемых результатов.
  • Изменения в планах: Описание любых изменений в первоначальных планах, причин этих изменений и их влияние на общий график проекта.
  • Риски: Описание возможных рисков, связанных с проектом, и меры по их минимизации.
  • Ресурсы: Обзор использования ресурсов, включая время, людей и технические средства.

Итоговый отчет

Представить итоговый отчет 7 октября 2024 года. Отчет должен включать обзор проделанной работы, анализ полученных результатов и рекомендации.

Обзор проделанной работы:

  • Методология: Описание использованных методов и подходов для выполнения задач по очистке данных, токенизации и нормализации.
  • Процесс выполнения: Детальное описание процесса выполнения каждой стадии работы, включая удаление дубликатов, нежелательного контента, обработку специальных символов, исправление ошибок, токенизацию и нормализацию данных.

 

«Центр поддержки цифрового правительства» теперь приглашает соответствующие требованиям компании выразить свою заинтересованность в выполнении этого задания. Заинтересованные компании должны предоставить информацию, указывающую на их квалификацию для выполнения услуг (брошюры, опыт внедрения и описание аналогичных заданий, наличие соответствующего квалифицированного персонала и т.д.). Критерии отбора компаний в короткий список, следующие:

Консультант в форме юридического лица или консорциума юридических лиц должен соответствовать следующим квалификационным требованиям для оказания услуг по Контракту:

  • наличие 3 летнего опыта в создании и разработке качественного аудио, видео и текстового контента на казахском языке и их популяризации).

Наличие команды из филологов и высококвалифицированных IT специалистов, соответствующим к следующим критериям:

Квалификация

Количество

1

Специалист с высшим профессиональным образованием в области ИТ/ИКТ и/или инженерии (машинное обучение, большие данные, дата-аналитика, администрирование баз данных, искусственный интеллект)

10

2

Специалист со степенью PhD в области филологии казахского языка

1

3

Специалист с ученой степенью кандидата наук в области филологии казахского языка

2

4

Специалист с ученым званием ассоциированного профессора (доцента) в области филологии казахского языка

1

Преимуществом будет:

  • доказанный опыт работы с библиотеками машинного обучения (например, TensorFlow, PyTorch, Keras, Scikit-learn);
  • Профессиональная cертификация или подтверждение прохождения курсов в сфере оказываемой услуги

 

Внимание заинтересованных компаний обращается на пункт 1.9 Руководства Всемирного банка "Отбор и наем консультантов заемщиками Всемирного банка" (редакция от января 2011 г., редакции от июля 2014 г.), в котором излагается политика Всемирного банка в отношении конфликта интересов.

Компании могут объединяться для повышения своей квалификации.

Компания будет выбрана с использованием метода отбора, основанного на квалификации Консультанта, в соответствии с процедурами, изложенными в Руководстве Всемирного банка "Отбор и наем консультантов заемщиками Всемирного банка" (редакция от января 2011 г., редакции от июля 2014 г.).

Все заинтересованные компании могут отправить свои заявления о заинтересованности, подписанные уполномоченным лицом, в формате PDF по электронной почте: Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра. (обязательная копия Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.или пришлите по указанному ниже адресу до крайнего срока 18:00 30 июля 2024 года (времени Астаны)

 

Биғари Рүстем Айдарбекұлы – Руководитель подпроекта «Разработка искусственного интеллекта на основе Большой Языковой Модели для казахского языка».

Почтовый адрес: г. Астана, район Есиль, проспект Мәңгілік Ел, 55/5, блок С 2.4, кабинет 3.03.

Почтовый индекс: 010000.

Телефон: ++7 7172 735297.

Адрес электронной почты: Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.

 

Showcases

Background Image

Header Color

:

Content Color

: