packages/tasks-gen/snippets-fixtures/conversational-vlm-non-stream/python/requests/0.hf-inference.py

import os import requests API_URL = "https://router.huggingface.co/hf-inference/models/meta-llama/Llama-3.2-11B-Vision-Instruct/v1/chat/completions" headers = { "Authorization": f"Bearer {os.environ['HF_TOKEN']}", } def query(payload): response = requests.post(API_URL, headers=headers, json=payload) return response.json() response = query({ "messages": [ { "role": "user", "content": [ { "type": "text", "text": "Describe this image in one sentence." }, { "type": "image_url", "image_url": { "url": "https://cdn.britannica.com/61/93061-050-99147DCE/Statue-of-Liberty-Island-New-York-Bay.jpg" } } ] } ], "model": "meta-llama/Llama-3.2-11B-Vision-Instruct" }) print(response["choices"][0]["message"])

packages/tasks-gen/snippets-fixtures/conversational-vlm-non-stream/python/requests/0.hf-inference.py (30 lines of code) (raw):