Автоматизация Desktop мессенджеров в Windows, Linux системах

Добрый день, есть задача в автоматизации действий пользователей desktop приложений Windows, Linux.
Собственно не могу найти инструмент, который бы идеально подходил к решению данной задачи.
Главный вопрос, каким образом автоматить действия пользователей в различных мессенджерах? например, к элементам telegramm нельзя пробраться по локаторам, получается единственным выходом использовать Sikuli?
И еще вопрос, если мы хотим проверить правильность текста который мы вставили, или файла который мы отправили Sikuli будет проверять через изображение или есть другие методы?

по сути, логика такая, сделали вставку в текстовое поле, сделали скриншот, распознали текст, проверили текст? А каким образом проверять наличие файлов или запущенный процесс, sikuli это умеет?

А потом к распознанному тексту применить расстояние Левинштейна, чтобы сравнить его с исходным.

SikuliX умет все то же что и Python (Jython). import os и вперед

Есть ли какие аналоги для решения подобных задач?

Платный UFT/LeanFT

Ну небезызвестный TestComplete вроде тоже умеет с картинками работать и текст распознавать. Они кажется, гордо именуют это AI feature… Не уверен, но ТС может даже умеет савнивать картинки разного размера. Однако 30 дней триал и потом денег хотят :slight_smile: