HuggingFace

# HuggingFace

HuggingFace Inference API for accessing various models.

Configuration¶

PROVIDER=huggingface
API_KEY=hf_your-huggingface-token
MODEL=meta-llama/Llama-3.1-70B-Instruct
TEMPERATURE=0.7
HF_PROVIDER=auto

Parameter	Description	Default
`API_KEY`	HuggingFace API token (required)	-
`MODEL`	Model to use	-
`TEMPERATURE`	Randomness (0.0-1.0)	`0.3`
`TOP_P`	Nucleus sampling	`1.0`
`MAX_TOKENS`	Max response tokens	`1024`
`TIMEOUT`	Request timeout (seconds)	`60`
`BASE_URL`	Custom API endpoint	-
`HF_PROVIDER`	HuggingFace provider	`auto`
`BILL_TO`	Billing configuration	-
`EXTRA_HEADERS`	Additional HTTP headers	`{}`