refactor: Remove non-streaming support (#229)

2026-02-01 04:40:21 -05:00 · 2025-09-17 19:38:27 +02:00
parent 561661b476
commit ec1b5bdf5f
33 changed files with 412 additions and 408 deletions
--- a/providers/LlamaCppProvider.cpp
+++ b/providers/LlamaCppProvider.cpp
@ -151,6 +151,9 @@ LLMCore::ProviderID LlamaCppProvider::providerID() const
 void LlamaCppProvider::sendRequest(
    const QString &requestId, const QUrl &url, const QJsonObject &payload)
 {
+    m_dataBuffers[requestId].clear();
+    m_requestUrls[requestId] = url;
+
    QNetworkRequest networkRequest(url);
    prepareNetworkRequest(networkRequest);

@ -165,16 +168,17 @@ void LlamaCppProvider::sendRequest(

 void LlamaCppProvider::onDataReceived(const QString &requestId, const QByteArray &data)
 {
-    QString &accumulatedResponse = m_accumulatedResponses[requestId];
+    LLMCore::DataBuffers &buffers = m_dataBuffers[requestId];
+    QStringList lines = buffers.rawStreamBuffer.processData(data);

    if (data.isEmpty()) {
        return;
    }

    bool isDone = data.contains("\"stop\":true") || data.contains("data: [DONE]");
+    QString tempResponse;

-    QByteArrayList lines = data.split('\n');
-    for (const QByteArray &line : lines) {
+    for (const QString &line : lines) {
        if (line.trimmed().isEmpty()) {
            continue;
        }
@ -184,25 +188,15 @@ void LlamaCppProvider::onDataReceived(const QString &requestId, const QByteArray
            continue;
        }

-        QByteArray jsonData = line;
-        if (line.startsWith("data: ")) {
-            jsonData = line.mid(6);
-        }
-
-        QJsonParseError error;
-        QJsonDocument doc = QJsonDocument::fromJson(jsonData, &error);
-        if (doc.isNull()) {
+        QJsonObject obj = parseEventLine(line);
+        if (obj.isEmpty())
            continue;
-        }
-
-        QJsonObject obj = doc.object();
        QString content;

        if (obj.contains("content")) {
            content = obj["content"].toString();
            if (!content.isEmpty()) {
-                accumulatedResponse += content;
-                emit partialResponseReceived(requestId, content);
+                tempResponse += content;
            }
        } else if (obj.contains("choices")) {
            auto message = LLMCore::OpenAIMessage::fromJson(obj);
@ -213,8 +207,7 @@ void LlamaCppProvider::onDataReceived(const QString &requestId, const QByteArray

            content = message.getContent();
            if (!content.isEmpty()) {
-                accumulatedResponse += content;
-                emit partialResponseReceived(requestId, content);
+                tempResponse += content;
            }

            if (message.isDone()) {
@ -227,9 +220,14 @@ void LlamaCppProvider::onDataReceived(const QString &requestId, const QByteArray
        }
    }

+    if (!tempResponse.isEmpty()) {
+        buffers.responseContent += tempResponse;
+        emit partialResponseReceived(requestId, tempResponse);
+    }
+
    if (isDone) {
-        emit fullResponseReceived(requestId, accumulatedResponse);
-        m_accumulatedResponses.remove(requestId);
+        emit fullResponseReceived(requestId, buffers.responseContent);
+        m_dataBuffers.remove(requestId);
    }
 }

@ -239,15 +237,16 @@ void LlamaCppProvider::onRequestFinished(const QString &requestId, bool success,
        LOG_MESSAGE(QString("LlamaCppProvider request %1 failed: %2").arg(requestId, error));
        emit requestFailed(requestId, error);
    } else {
-        if (m_accumulatedResponses.contains(requestId)) {
-            const QString fullResponse = m_accumulatedResponses[requestId];
-            if (!fullResponse.isEmpty()) {
-                emit fullResponseReceived(requestId, fullResponse);
+        if (m_dataBuffers.contains(requestId)) {
+            const LLMCore::DataBuffers &buffers = m_dataBuffers[requestId];
+            if (!buffers.responseContent.isEmpty()) {
+                emit fullResponseReceived(requestId, buffers.responseContent);
            }
        }
    }

-    m_accumulatedResponses.remove(requestId);
+    m_dataBuffers.remove(requestId);
+    m_requestUrls.remove(requestId);
 }

 } // namespace QodeAssist::Providers