Skip to main content

Visual Studio Code und OpenCode

Wie nutzt ihr Visual Studio Code und OpenCode mit dem PING KI Server?

Zunächst braucht ihr das Bearer Token. Es heißt manchmal auch API Token. Siehe https://ki.ping.de:9443/protected/

Dann geht es wie folgt: 

Visual Studio Code

Für VS Code gibt es mehrere KI-Plugins die in Frage kommen. Hier findet ihr für einige exemplarische die benötigten Schritte zur Konfiguration: 

Cline Plugin

  1. In VS Code das Cline Plugin installieren. Achtet darauf dass es das blaue Checkmark hat:

    • cline1.png

  2. How will you use Cline? "Bring my own API key"

  3. API Provider: Ollama

  4. Custom base URL: https://ki.ping.de:114348000 

  5. Ollama API key: bitte_erfragen (nutzt das Bearer Token)

  6. Model: devstral-small-2:24b-instruct-2512-q8_0cyankiwi/Qwen3.6-35B-A3B-AWQ-4bit

Fertig! 

Kilo Code Plugin

  1. In VS Code das Kilo Code AI Agent Plugin installieren. Achtet darauf dass ihr kein falsches erwischt. Aktuell sieht es etwa so aus:

    • kilo code vs code.png

  2. Wählt "Use your own API key"
  3. API Provider: Ollama
  4. Base URL: https://ki.ping.de:114348000

  5. API Key: bitte_erfragen

  6. Model Name: devstral-small-2:24b-instruct-2512-q8_0cyankiwi/Qwen3.6-35B-A3B-AWQ-4bitFertig! 

Fertig! 

Continue Plugin

Installiert das Continue Plugin in VS Code.

continue vs code.png

Nehmt folgende Config Datei.Datei (ungeprüft). Tragt dort den API Key ein in der letzten Zeile. 

name: Local Config
version: 1.0.0
schema: v1
models:
  - name: qwen3-coder
    provider: ollamaopenai
    model: qwen3-coder:30b-a3b-q8_0cyankiwi/Qwen3.6-35B-A3B-AWQ-4bit
    apiBase: https://ki.ping.de:114348000
    roles:
    - chat
    - autocomplete
    - edit
    - apply
    - summarize
    defaultCompletionOptions:
      contextLength: 65000
    requestOptions:
      headers:
        Authorization: Bearer bitte_erfragen

OpenCode

Für OpenCode müsst ihr eine opencode.json Datei anlegen z.B. im Verzeichnis ~/.config/opencode/

Ermittelt welche Modelle der Server anbietet, die euch fürs Programmieren interessieren:

BEARER_TOKEN=bitte_erfragen
curl -sH "Authorization: Bearer $BEARER_TOKEN" https://ki.ping.de:11434/api/tags|v1/models|jq -r '.models[]|"\(.name)\t\t\((.size/1024/1024/1024*10|floor)/10) GB"'

Aktueller Output:Aktuell (2026-01):04) gibt es nur ein Model: cyankiwi/Qwen3.6-35B-A3B-AWQ-4bit

Es ist gut und schnell und bietet viel Kontext, Tool calling, ist multi-modal etc.

qwen3-coder:30b-a3b-q8_0                30.2 GB
devstral-small-2:24b-instruct-2512-q8_0         24.1 GB
nemotron-3-nano:30b-a3b-q8_0            31.2 GB
qwen3:30b-a3b-instruct-2507-q8_0                30.2 GB
gpt-oss:latest          12.8 GB
nomic-embed-text:latest         0.2 GB
gemma3:27b-it-q8_0              27.5 GB

Dann tragt das/die Modelle in die opencode.json Datei ein, in etwa wie so:

{
  "$schema": "https://opencode.ai/config.json",
  "provider": {
    "ollama": {
      "npm": "@ai-sdk/openai-compatible",
      "name": "OllamavLLM (PING)",
      "options": {
        "baseURL": "https://ki.ping.de:11434/8000/v1"
      },
      "models": {
        "devstral-small-2:24b-instruct-2512-q8_0"cyankiwi/Qwen3.6-35B-A3B-AWQ-4bit": {
          "name": "Devstral-Small-2 2512"
        },
        "qwen3-coder:30b-a3b-q8_0": {
          "name": "Qwen3-Coder 30B A3B Q8"
        },
        "gpt-oss:latest": {
          "name": "GPT-OSS 20B"Qwen3.6"
        }
      }
    }
  }
}

Wenn ihr das nächste Mal OpenCode startet und /connect tippt könnt ihr nach "PING" suchen und solltet den Eintrag "OllamavLLM (PING)" angezeigt bekommen. Wenn euch dann das OpenCode nach dem API Key fragt, gibt bittegebt das Bearer Token ein,(s.o.) das ihr erfragen müsst.ein.