Препоръчана статия
Strategy

Изграждане на готова за AI база от данни

Екипът на TAKT
14 мин четене

Подготовка на вашата производствена инфраструктура за данни за приложения с изкуствен интелект

AI и машинно обучение в производството

Изграждане на готова за AI база от данни

Всеки иска да "прави AI". Ръководителите четат за ChatGPT, предсказуема поддръжка (predictive maintenance) или компютърно зрение и настояват да знаят кога тяхната фабрика ще бъде "задвижвана от AI".

Но опитът да добавите AI към типична фабрика е като опит да построите небостъргач върху блато. Ако основата – вашите данни – е разхвърляна, нестабилна и неструктурирана, структурата ще се срути. Алгоритмите са толкова добри, колкото горивото, което им подавате.

Аналогията с библиотеката: Защо "Big Data" не е достатъчно

Представете си, че искате да обучите брилянтен студент (AI), който да бъде експерт по историята и операциите на вашата фабрика. Изпращате го в библиотека (вашата база данни), за да се учи.

Сценарий А: Разхвърляната библиотека

  • Книгите са хвърлени на огромна купчина на пода.
  • Половината страници са скъсани или на петна от кафе.
  • Някои книги са написани на таен код, който само "Иван от поддръжката" знае.
  • Секция "История" е смесена със секция "Фантастика".
  • Няма дати на вестниците.

Студентът няма да научи нищо. Или по-лошо, ще научи грешните неща. Така изглеждат повечето фабрични данни днес: несвързани електронни таблици, хартиени дневници, собствени протоколи на машини и "Data Lakes" (езера от данни), които всъщност са "Data Swamps" (блата от данни).

Сценарий Б: Организираната библиотека

  • Книгите са подредени по категории (Контекстуализирани).
  • Всяка книга има стандартен индекс и съдържание (Структурирани).
  • Липсващите страници са отбелязани или възстановени (Качество на данните).
  • Езикът е последователен във всички томове (Стандартизирани).

Това е Готова за AI база от данни.

3-те стъпки за почистване на библиотеката

За да стигнете от Сценарий А до Сценарий Б, трябва да се съсредоточите върху три стълба на готовността на данните.

1. Контекстуализация ("Кой, Какво, Къде")

Суровите данни от сензорите често са безсмислени. Отчитане на температурен сензор от "450°C" не ви казва нищо само по себе си.

  • Високо ли е това? Може би за фризера, но не и за пещта.
  • Какъв продукт е имало вътре? Може би Продукт А се нуждае от 450°C, но Продукт Б се топи при 400°C.
  • Коя поръчка е вървяла? Това поръчка на клиент ли е било или тестов пуск?

Трябва да свържете процесните данни (данни от сензори във времеви редове) с бизнес данните (работни поръчки, спецификации на продукти, графици на смени). Една MES (Система за изпълнение на производството) прави това автоматично, създавайки "рамка на контекста" около всяка точка от данни.

2. Стандартизация (Говорене на един език)

Фабриките са Вавилонска кула.

  • Машина А (немска) отчита скоростта в "метри в минута".
  • Машина Б (американска) отчита скоростта във "футове в секунда".
  • Машина В (стара) отчита скоростта като сурово напрежение (0-10V).

AI не може да намери модели, ако мерните единици не съвпадат. Той ще си помисли, че Машина В работи на "5" (волта), докато Машина А работи на "300" (м/мин), предполагайки, че Машина А е 60 пъти по-бърза.

Имате нужда от Слой за нормализиране – мидълуер, който преобразува всичко в общ стандарт (напр. SI единици), преди да попадне в базата данни.

3. Пълнота и непрекъснатост (Попълване на празнините)

AI моделите, особено за прогнозиране на времеви редове, мразят празнините. Ако мрежата ви прекъсва за 10 минути на всеки час, AI вижда "черни дупки" във времевата линия. Може да интерпретира прекъсване на мрежата като престой на машината, което води до грешни заключения.

Имате нужда от надежден Edge Buffering. Това означава, че машината или гейтуеят съхранява данни локално, когато мрежата е паднала, и ги "допълва" към сървъра, след като връзката се възстанови.

Дебатът "Cloud срещу Edge"

Къде трябва да живее тази библиотека?

  • The Cloud (Облакът): Чудесен за дългосрочно съхранение и обучение на тежки модели (напр. анализ на 5 години данни за намиране на сезонни тенденции).
  • The Edge (Периферията): От съществено значение за изпълнение в реално време. Ако искате AI да спре машина преди да се счупи, AI трябва да живее на машината (Edge), а не в център за данни на 500 мили разстояние.

Готовата за AI основа обикновено включва хибриден подход: Обучение в облака, внедряване в периферията (Train in the Cloud, Deploy at the Edge).

Не купувайте покрива преди основата

Много компании правят грешката да купуват скъпи AI инструменти или да наемат специалисти по данни (data scientists) първо, само за да осъзнаят, че нямат чисти данни, с които да ги захранват. Специалистите по данни прекарват 90% от времето си в "чистене" на данните (почистване, сортиране, поправяне) и само 10% в действително изграждане на модели.

Правилният ред на операциите:

  1. Дигитализиране: Отървете се от хартията.
  2. Централизиране: Свържете машините към единна MES/Historian система.
  3. Контекстуализиране: Уверете се, че данните са маркирани с информация за продукт/поръчка.
  4. Анализиране: Сега сте готови за AI.

Заключение

AI не е магия; това е математика. А математиката изисква добри числа. Ако искате "магическите" резултати от предсказуемата поддръжка, оптимизацията на добива и автономното планиране, първо трябва да свършите тежката работа по организирането на вашата библиотека.

Екипът на TAKT

Експертен автор и сътрудник на TAKT Software. Споделяне на прозрения за производство, MES, ERP и индустрия 4.0.

Информация за статията

Време за четене

14 мин

Публикувано

Aug 19, 2024

Категория

Strategy

Имате ли въпроси?

Имате ли нужда да обсъдите тази тема? Свържете се с нашия екип за консултация.

Готови ли сте да трансформирате производството си?

Научете как TAKT ERP може да ви помогне да постигнете видимост и контрол в реално време във всички операции.