partial move to file

2023-12-14 21:45:01 +01:00 · 2023-12-14 21:45:01 +01:00 · 0a493294cf
commit 0a493294cf
parent efb85c2cb4
3 changed files with 106 additions and 85 deletions
--- a/src/extension.ts
+++ b/src/extension.ts
@ -1,54 +1,9 @@
 import { ok } from 'assert';
 import * as vscode from 'vscode';
 import commentPrefix from './comments.json';
 import {createLlamacppRequest, llamaData, llamaRequest, llamacppRequestEndpoint} from  './llamacpp-api';
 // llama.cpp server response format
 type llamaData = {
 	content: string,
 	generation_settings: JSON,
 	model: string,
 	prompt: string,
 	stopped_eos: boolean,
 	stopped_limit: boolean,
 	stopped_word: boolean,
 	stopping_word: string,
 	timings: {
 		predicted_ms: number,
 		predicted_n: number,
 		predicted_per_second: number,
 		predicted_per_token_ms: number,
 		prompt_ms: number,
 		prompt_n: number,
 		prompt_per_second: number,
 		prompt_per_token_ms: number
 	},
 	tokens_cached: number,
 	tokens_evaluated: number,
 	tokens_predicted: number,
 	truncated: boolean
 };
 type llamaRequest = {
 	n_predict: number,
 	mirostat: number,
 	repeat_penalty: number,
 	frequency_penalty: number,
 	presence_penalty: number,
 	repeat_last_n: number,
 	temperature: number,
 	top_p: number,
 	top_k: number,
 	typical_p: number,
 	tfs_z: number,
 	seed: number,
 	stream: boolean,
 	cache_prompt: boolean,
 	prompt?: string,
 	input_prefix?: string,
 	input_suffix?: string
 };
 type fetchErrorCause = {
 	errno: number,
 	code: string,
@ -172,51 +127,14 @@ export function activate(context: vscode.ExtensionContext) {
 			// FIXME: is there a more efficient way?
 			doc_before = pfx + ' ' + fname + sfx + '\n' + doc_before;
-			const fim = config.get("fimEnabled") as boolean;
+			const request: llamaRequest = createLlamacppRequest(config, doc_before, doc_after);
 			const fimRequest = config.get("useFillInMiddleRequest") as boolean;
 			let req_str: string;
 			let request: llamaRequest = {
 				n_predict: config.get("llamaMaxtokens") as number,
 				mirostat: config.get("llamaMirostat") as number,
 				repeat_penalty: config.get("llamaRepeatPenalty") as number,
 				frequency_penalty: config.get("llamaFrequencyPenalty,") as number,
 				presence_penalty: config.get("llamaPresencePenalty,") as number,
 				repeat_last_n: config.get("llamaRepeatCtx,") as number,
 				temperature: config.get("llamaTemperature") as number,
 				top_p: config.get("llamaTop_p") as number,
 				top_k: config.get("llamaTop_k") as number,
 				typical_p: config.get("llamaTypical_p") as number,
 				tfs_z: config.get("llamaTailfree_z,") as number,
 				seed: config.get("llamaSeed") as number,
 				stream: false,
 				cache_prompt: config.get("llamaCachePrompt") as boolean
 			};
 			// check if fill in middle is enabled and fill the request prompt accordingly
 			if (fim === true) {
 				if (fimRequest === true) {
 					req_str = '/infill';
 					request.input_prefix = doc_before;
 					request.input_suffix = doc_after;
 				} else {
 					const fim_beg = config.get("fimBeginString") as string;
 					const fim_hole = config.get("fimHoleString") as string;
 					const fim_end = config.get("fimEndString") as string;
 					req_str = '/completion';
 					request.prompt = fim_beg + doc_before + fim_hole + doc_after + fim_end;
 				}
 			} else {
 				req_str = '/completion';
 				request.prompt = doc_before;
 			}
 			console.log(JSON.stringify(request));
 			let data: llamaData;
 			// try to send the request to the running server
 			try {
 				const response_promise = fetch(
-					(config.get("llamaHost") as string).concat(req_str),
+					llamacppRequestEndpoint(config),
 					{
 						method: 'POST',
 						headers: {
--- a/src/llamacpp-api.ts
+++ b/src/llamacpp-api.ts
@ -0,0 +1,103 @@
 import * as vscode from 'vscode';
 // llama.cpp server response format
 export type llamaData = {
 	content: string,
 	generation_settings: JSON,
 	model: string,
 	prompt: string,
 	stopped_eos: boolean,
 	stopped_limit: boolean,
 	stopped_word: boolean,
 	stopping_word: string,
 	timings: {
 		predicted_ms: number,
 		predicted_n: number,
 		predicted_per_second: number,
 		predicted_per_token_ms: number,
 		prompt_ms: number,
 		prompt_n: number,
 		prompt_per_second: number,
 		prompt_per_token_ms: number
 	},
 	tokens_cached: number,
 	tokens_evaluated: number,
 	tokens_predicted: number,
 	truncated: boolean
 };
 export type llamaRequest = {
 	n_predict: number,
 	mirostat: number,
 	repeat_penalty: number,
 	frequency_penalty: number,
 	presence_penalty: number,
 	repeat_last_n: number,
 	temperature: number,
 	top_p: number,
 	top_k: number,
 	typical_p: number,
 	tfs_z: number,
 	seed: number,
 	stream: boolean,
 	cache_prompt: boolean,
 	prompt?: string,
 	input_prefix?: string,
 	input_suffix?: string
 };
 export function createLlamacppRequest(config: vscode.WorkspaceConfiguration, doc_before: string, doc_after: string): llamaRequest
 {
 	let request: llamaRequest = {
 		n_predict: config.get("llamaMaxtokens") as number,
 		mirostat: config.get("llamaMirostat") as number,
 		repeat_penalty: config.get("llamaRepeatPenalty") as number,
 		frequency_penalty: config.get("llamaFrequencyPenalty,") as number,
 		presence_penalty: config.get("llamaPresencePenalty,") as number,
 		repeat_last_n: config.get("llamaRepeatCtx,") as number,
 		temperature: config.get("llamaTemperature") as number,
 		top_p: config.get("llamaTop_p") as number,
 		top_k: config.get("llamaTop_k") as number,
 		typical_p: config.get("llamaTypical_p") as number,
 		tfs_z: config.get("llamaTailfree_z,") as number,
 		seed: config.get("llamaSeed") as number,
 		stream: false,
 		cache_prompt: config.get("llamaCachePrompt") as boolean
 	};
 	const fim = config.get("fimEnabled") as boolean;
 	const fimRequest = config.get("useFillInMiddleRequest") as boolean;
 	if (fim === true) {
 		if (fimRequest === true) {
 			request.input_prefix = doc_before;
 			request.input_suffix = doc_after;
 		} else {
 			const fim_beg = config.get("fimBeginString") as string;
 			const fim_hole = config.get("fimHoleString") as string;
 			const fim_end = config.get("fimEndString") as string;
 			request.prompt = fim_beg + doc_before + fim_hole + doc_after + fim_end;
 		}
 	} else {
 		request.prompt = doc_before;
 	}
 	return request;
 }
 export function llamacppRequestEndpoint(config: vscode.WorkspaceConfiguration): string
 {
 	const fim = config.get("fimEnabled") as boolean;
 	const fimRequest = config.get("useFillInMiddleRequest") as boolean;
 	let req_str: string = config.get("llamaHost") as string;
 	if (fim === true && fimRequest === true) {
 		req_str += '/infill';
 	} else {
 		req_str += '/completion';
 	}
 	return req_str;
 }
--- a/src/openai-api.ts
+++ b/src/openai-api.ts