Visual Studio Code und OpenCode

Wie nutzt ihr Visual Studio Code und OpenCode mit dem PING KI Server?

Zunächst braucht ihr das Bearer Token. Es heißt manchmal auch API Token. Siehe https://ki.ping.de:9443/protected/

Dann geht es wie folgt:

Visual Studio Code

Für VS Code gibt es mehrere KI-Plugins die in Frage kommen. Hier findet ihr für einige exemplarische die benötigten Schritte zur Konfiguration:

Cline Plugin

In VS Code das Cline Plugin installieren. Achtet darauf dass es das blaue Checkmark hat:
How will you use Cline? "Bring my own API key"
API Provider: Ollama
Custom base URL: https://ki.ping.de:114348000
Ollama API key: bitte_erfragen (nutzt das Bearer Token)
Model: devstral-small-2:24b-instruct-2512-q8_0cyankiwi/Qwen3.6-35B-A3B-AWQ-4bit

Fertig!

Kilo Code Plugin

In VS Code das Kilo Code AI Agent Plugin installieren. Achtet darauf dass ihr kein falsches erwischt. Aktuell sieht es etwa so aus:
Wählt "Use your own API key"
API Provider: Ollama
Base URL: https://ki.ping.de:114348000
API Key: bitte_erfragen
Model Name: devstral-small-2:24b-instruct-2512-q8_0cyankiwi/Qwen3.6-35B-A3B-AWQ-4bitFertig!

~~Fertig!~~

Continue Plugin

Installiert das Continue Plugin in VS Code.

continue vs code.png

Nehmt folgende Config ~~Datei.~~Datei (ungeprüft). Tragt dort den API Key ein in der letzten Zeile.

name: Local Config
version: 1.0.0
schema: v1
models:
  - name: qwen3-coder
    provider: ollamaopenai
    model: qwen3-coder:30b-a3b-q8_0cyankiwi/Qwen3.6-35B-A3B-AWQ-4bit
    apiBase: https://ki.ping.de:114348000
    roles:
    - chat
    - autocomplete
    - edit
    - apply
    - summarize
    defaultCompletionOptions:
      contextLength: 65000
    requestOptions:
      headers:
        Authorization: Bearer bitte_erfragen

OpenCode

Für OpenCode müsst ihr eine opencode.json Datei anlegen z.B. im Verzeichnis ~/.config/opencode/

Ermittelt welche Modelle der Server anbietet, die euch fürs Programmieren interessieren:

BEARER_TOKEN=bitte_erfragen
curl -sH "Authorization: Bearer $BEARER_TOKEN" https://ki.ping.de:11434/api/tags|v1/models|jq -r '.models[]|"\(.name)\t\t\((.size/1024/1024/1024*10|floor)/10) GB"'

~~Aktueller Output:~~Aktuell (2026-~~01):~~04) gibt es nur ein Model: cyankiwi/Qwen3.6-35B-A3B-AWQ-4bit

Es ist gut und schnell und bietet viel Kontext, Tool calling, ist multi-modal etc.

qwen3-coder:30b-a3b-q8_0                30.2 GB
devstral-small-2:24b-instruct-2512-q8_0         24.1 GB
nemotron-3-nano:30b-a3b-q8_0            31.2 GB
qwen3:30b-a3b-instruct-2507-q8_0                30.2 GB
gpt-oss:latest          12.8 GB
nomic-embed-text:latest         0.2 GB
gemma3:27b-it-q8_0              27.5 GB

Dann tragt das/die Modelle in die opencode.json Datei ein, in etwa wie so:

{
  "$schema": "https://opencode.ai/config.json",
  "provider": {
    "ollama": {
      "npm": "@ai-sdk/openai-compatible",
      "name": "OllamavLLM (PING)",
      "options": {
        "baseURL": "https://ki.ping.de:11434/8000/v1"
      },
      "models": {
        "devstral-small-2:24b-instruct-2512-q8_0"cyankiwi/Qwen3.6-35B-A3B-AWQ-4bit": {
          "name": "Devstral-Small-2 2512"
        },
        "qwen3-coder:30b-a3b-q8_0": {
          "name": "Qwen3-Coder 30B A3B Q8"
        },
        "gpt-oss:latest": {
          "name": "GPT-OSS 20B"Qwen3.6"
        }
      }
    }
  }
}

Wenn ihr das nächste Mal OpenCode startet und /connect tippt könnt ihr nach "PING" suchen und solltet den Eintrag "~~Ollama~~vLLM (PING)" angezeigt bekommen. Wenn euch dann das OpenCode nach dem API Key fragt, ~~gibt bitte~~gebt das Bearer Token ~~ein,~~(s.o.) ~~das ihr erfragen müsst.~~ein.