Запуск Llama 405b на своем сервере. vLLM, docker.

Uploaded By: Myvideo

Published on

29 Aug 2024

1 view

0

0 votes

0

About Share Download Add to

Детально показываю, как запустить самую мощную открытую нейросеть Llama 405b на своем сервере. Описание модели Llama 405b на сайте Meta* Сервер покупал тут: Прикладная конференция по Data Science AI conf 2024: Описание модели Llama 3.5 405b instruct AWQ на huggingface: Доступ ко всем сайтам получаю тут: vllm - проект по инференсу нейросетей: Рейтинг нейросетей: Мой телеграм канал: В rutube дублирую видео. Подписывайтесь на случай замедления ютуба: Команда для запуска vLLM в докере: sudo docker run --ipc=host --log-opt max-size=10m --log-opt max-file=1 --rm -it --gpus '“device=0,1,2,3“' -p 8000:8000 --mount type=bind,source=/home/ubuntu/.cache,target=/root/.cache vllm/vllm-openai: --model hugging-quants/ --tensor-parallel-size 4 --gpu-memory-utilization --dtype half -q awq --disable-log-requests Таймкоды: 0:00 Llama 405b 0:55 Файлы нейросети 1:40 Покупка сервера с 4 gpu A100 4:12 Установка docker 5:18 Запуск сервера vllm 7:15 Первые ответы 9:20 бенчмарк- тест скорости сервера 11:15 стоимость запуска 12:50 еще один тест 15:30 выводы * Признана экстремистской организацией в РФ. Реклама. ООО «ДТЛ». ИНН 9717073792. erid: LjN8K1LTF

Share with your friends

Link:

Embed:

<iframe width="640" height="360" src="//myvideo.cc/embed/WXFMa3FUTkJzTzA5UUtaRkdPeW5xeW8ySGZvZjNlVmFBOXZPOFUzS015Yz0" frameborder="0" webkitallowfullscreen mozallowfullscreen allowfullscreen></iframe>

Video Size:

Custom size:

x

Autoplay video

Hide player controls

Hide resume playing

Add to Playlist:

Favorites

My Playlist

Watch Later

LLama 3.1 Бесплатная Нейросеть на Твоем ПК Локально. Запусти за 10 минут

13 hours ago

00:12:58

LLama 3.1 Бесплатная Нейросеть на Твоем ПК Локально. Запусти за 10 минут

1 8%

LLaMA-Omni : Речевое управление LLM LLaMA-Omni - модель, построенная на основе Llama-3

3 days ago

00:00:36

LLaMA-Omni : Речевое управление LLM LLaMA-Omni - модель, построенная на основе Llama-3

1 36%

gpt4all - оболочка для больших языковых моделей с открытым исходным кодом на локальном компьютере

3 days ago

00:10:29

gpt4all - оболочка для больших языковых моделей с открытым исходным кодом на локальном компьютере

1 34%

Запускаем RAG через llama3 с помощью LM studio и Anything LLM на своем компьютере

3 days ago

00:14:32

Запускаем RAG через llama3 с помощью LM studio и Anything LLM на своем компьютере

1 66%

2024-09-07 Запуск RPC на RepkaPi 3

6 days ago

04:20:27

2024-09-07 Запуск RPC на RepkaPi 3

7 53%

Продуктивный Совет Создавай ИИ-агентов при помощи n8n локально: Lamma 3.1, Gemma, Phi 3,5

6 days ago

00:18:16

Продуктивный Совет Создавай ИИ-агентов при помощи n8n локально: Lamma 3.1, Gemma, Phi 3,5

23 77%

Как делать ИИ-агентов локально Lamma 3.1, Gemma, Phi БЕЗ КОДА

1 week ago

00:18:17

Как делать ИИ-агентов локально Lamma 3.1, Gemma, Phi БЕЗ КОДА

1 23%

Продуктивный Совет LLama 3.1 Бесплатная Нейросеть на Твоем ПК Локально. Запусти за 10 минут

3 weeks ago

00:15:23

Продуктивный Совет LLama 3.1 Бесплатная Нейросеть на Твоем ПК Локально. Запусти за 10 минут

34 40%

ОТКРЫТИЕ ЖИВОТНЫХ / 60FPS 8K ВИДЕО ULTRA HD #8K #ANIMAL

4 weeks ago

01:00:44

ОТКРЫТИЕ ЖИВОТНЫХ / 60FPS 8K ВИДЕО ULTRA HD #8K #ANIMAL

468 16%

Разблокировка YouTube

1 month ago

00:02:17

Разблокировка YouTube

24 58%

Развод Wildberries и другие новости недели

2 months ago

00:16:51

Развод Wildberries и другие новости недели

241 33%

Новый аналог chatGPT: Запуск Llama 3 с Ollama

2 months ago

00:00:46

Новый аналог chatGPT: Запуск Llama 3 с Ollama

1 86%

Как запустить LLM локально | llama и mistral Junior

3 months ago

00:09:37

Как запустить LLM локально | llama и mistral Junior

5 37%

Спотовые биржевые фонды на эфир одобрены / Как это повлияло на курс ETH / Новости криптовалют

4 months ago

00:05:03

Спотовые биржевые фонды на эфир одобрены / Как это повлияло на курс ETH / Новости криптовалют

1 90%

На HuggingFace появилась фича Use this model для запуска LLM и Text-2-Image моделей у себя локально через желаемый софт....

4 months ago

00:01:10

На HuggingFace появилась фича Use this model для запуска LLM и Text-2-Image моделей у себя локально через желаемый софт....

14 30%

Llama 3 - лучшая открытая нейросеть. Узнай как использовать эту модель.

4 months ago

00:13:29

Llama 3 - лучшая открытая нейросеть. Узнай как использовать эту модель.

1 79%

LMstudio как замена ChatGPT: Saiga Mistral, LLama и другие локальные LLM

5 months ago

00:15:24

LMstudio как замена ChatGPT: Saiga Mistral, LLama и другие локальные LLM

1 28%

Что Скрывает Бесконечное Обновление 20w14infinite | Майнкрафт Открытия

6 months ago

00:15:38

Что Скрывает Бесконечное Обновление 20w14infinite | Майнкрафт Открытия

1 71%

Nerkin Что Скрывает Бесконечное Обновление 20w14infinite | Майнкрафт Открытия

6 months ago

00:15:37

Nerkin Что Скрывает Бесконечное Обновление 20w14infinite | Майнкрафт Открытия

75 34%

Я запустил свою нейросеть-аналог ChatGPT на ноутбуке

7 months ago

00:09:02

Я запустил свою нейросеть-аналог ChatGPT на ноутбуке

1 86%

Какой блокчейн метит в фавориты 2024

10 months ago

00:04:41

Какой блокчейн метит в фавориты 2024

1 92%

Llama and its fine-tunning Карина Романова

1 year ago

01:25:37

Llama and its fine-tunning Карина Романова

575 30%

Дропа SUI не будет | Перезапуск FTX | Взломы AAVE, YEARN и SUSHI | Монетизация в Twitter

1 year ago

00:21:52

Дропа SUI не будет | Перезапуск FTX | Взломы AAVE, YEARN и SUSHI | Монетизация в Twitter

1 37%

В десктопной версии ChatGPT можно отменить контроль и цензуру для этого понадобится 4 Gb ОЗУ.

1 year ago

00:00:18

В десктопной версии ChatGPT можно отменить контроль и цензуру для этого понадобится 4 Gb ОЗУ.

29 88%

0 Comments

Guest