تسرکت یه پروژه متن باز است که برای زبان های زیادی از جمله انگلیسی و عربی آموزش داده شده است و قابلیت آموزش زبان های جدید را داراست.

برای آموزش باید حداقل دو فایل تهیه شود. یکی تصویر یک متن با فرمت tif  یا  pngکه میان کلمات آن فاصله گذاری بیش از حالت عادی صورت گرفته باشد و فایل متنی با پسوند باکس که مختصات حروف یا زیرکلمه های موجود در عکس در آن بیان شده است. زیرکلمه به حروف به هم چسبیده ای میگویند که مجموع آنها کلمات را تشکیل می دهد.

همچنین میتوان چند دیکشنری (دیکشنری کلمات متداول و دیکشنری تمام کلمات یک زبان) را در مرحله آموزش با فرمت dawg برای بهبود عملکرد برنامه به آن اضافه کرد.