Кращі моделі, ніж DeepSeek, і як їх встановити локально

Деякі моделі ШІ можна встановити локально

Кілька днів тому мій партнер Pablinux - сказав він їм як локально встановити модну модель штучного інтелекту. У цьому дописі я перелічу моделі, які я вважаю кращими за DeepSeek, і як їх встановити та запустити на нашому комп’ютері.

Залишаючи осторонь будь-які політичні симпатії чи антипатії, крок китайського уряду був шедевром дипломатичного маркетингу, гідним Сунь Цзи. На відміну від стилю Дональда Трампа «Elephant in the Chinaware», вони анонсували модель, яка безкоштовно пропонує ті самі функції, що й ChatGPT, і споживає менше ресурсів. Це знають лише ті з нас, хто стежить за темою Протягом тривалого часу існує багато інших моделей з відкритим вихідним кодом (деякі від північноамериканських компаній, таких як Meta), і продуктивність DeepSeek можна порівняти з ChatGPT лише у найпоширеніших 5% випадків використання.

Масштабні мовні моделі

ChatGPT, DeepSeek та інші називаються великомасштабними мовними моделями. В основному Вони дозволяють користувачеві взаємодіяти з комп’ютером мовою, схожою на мову, яка використовується для спілкування з іншою людиною. Щоб досягти цього, вони навчаються великому об’єму тексту та правилам, які дозволяють їм створювати нову інформацію з уже наявної.
Його головне використання — відповідати на запитання, узагальнювати тексти, робити переклади та відтворювати вміст.

Кращі моделі, ніж DeepSeek, і як їх встановити локально

Як і Pablinux, ми будемо використовувати Ollama. Це інструмент, який дозволяє нам встановлювати, видаляти та використовувати різні моделі з відкритим кодом із терміналу Linux. У деяких випадках браузер можна використовувати як графічний інтерфейс, але ми не розглядатимемо це в цій статті.

Щоб Ollama забезпечувала належну взаємодію з користувачем, найкраще мати виділений графічний процесор.Особливо в моделях з більшою кількістю параметрів. Однак менш потужні можна використовувати на Raspberry Pi, і коли я навіть тестував моделі з 7 мільярдами параметрів на комп’ютері з 6 гігабайтами і без виділеного графічного процесора, комп’ютер працював без будь-яких збоїв. З одним із 13 мільярдів цього не сталося.

Параметри — це правила, які модель використовує для побудови зв’язків і шаблонів між даними. Чим більше параметрів і даних, тим потужнішою буде модель; ті, у кого менше параметрів, розмовляють іспанською, як Тарзан.

Ми можемо встановити Ollama за допомогою команд
sudo apt install curl
curl -fsSL https://ollama.com/install.sh | sh

Ми можемо встановити модель за допомогою команди:
ollama pull nombre_del modelo
І запустіть його за допомогою:
ollama run nombre_del_modelo
Ми видаляємо його за допомогою:
ollama rm nombre_del_modelo
Ми можемо побачити встановлені моделі, ввівши:
ollama list

Нижче наведено невеликий список моделей, які мені здаються найбільш цікавими: Повний список доступних моделей можна знайти тут тут:

llama2-без цензури

Llama — це модель загального призначення, створена Meta. У цій версії знято всі обмеження, введені розробниками оригінального проекту з юридичних чи політичних причин.. Він має дві версії: легку, яка обходиться з 8 ГБ, і повну, для якої потрібно 64. Її можна використовувати, щоб відповідати на запитання, писати тексти або виконувати завдання з кодування.
Встановлює за допомогою:
ollama pull llama2-uncensored
І він працює з:
ollama run llama2-uncensored

кодегема

CodeGemma — це вибір легких, але потужних шаблонів, які дозволяють виконувати різноманітні завдання програмування як завершити код або написати його з нуля. Розуміє природну мову, може виконувати інструкції та робити математичні міркування.

Випускається в 3 варіантах:

  • Інструктувати: Він перетворює природну мову на код і може слідувати інструкціям:
  • код:  Завершіть і згенеруйте код із частин існуючого коду.
  • 2b: Швидше завдання завершення коду.

Тиніллама

Як видно з назви, це зменшена версія оригінальної моделі Meta.. Тому це не дасть таких хороших результатів, але якщо ви хочете побачити, як модель штучного інтелекту працює на скромному обладнанні, варто спробувати. Він має лише 1100 мільярда параметрів.

Використання моделей на локальному рівні має такі переваги, як конфіденційність і доступ до нецензурованих і неупереджених версій, які в деяких випадках, як правило, закінчуються смішно. Штучний інтелект Microsoft відмовився створити для мене образ такси, оскільки вважав термін «сука» образливим. Найбільшим недоліком є ​​апаратні вимоги. Потрібно випробувати моделі та знайти ту, яка буде достатньо хорошою для того, що вам потрібно, і працюватиме на вашому обладнанні.


Залиште свій коментар

Ваша електронна адреса не буде опублікований. Обов'язкові для заповнення поля позначені *

*

*

  1. Відповідальний за дані: Мігель Анхель Гатон
  2. Призначення даних: Контроль спаму, управління коментарями.
  3. Легітимація: Ваша згода
  4. Передача даних: Дані не передаватимуться третім особам, за винятком юридичних зобов’язань.
  5. Зберігання даних: База даних, розміщена в мережі Occentus Networks (ЄС)
  6. Права: Ви можете будь-коли обмежити, відновити та видалити свою інформацію.