pytorch · mycpuorg · May 4, 2020 · Apr 25, 2020 · Apr 28, 2020 · Apr 28, 2020
diff --git a/ci/buildspec.yml b/ci/buildspec.yml
@@ -6,7 +6,7 @@ phases:
   install:
     commands:
       - apt-get update
-      - apt-get install -y curl
+      - apt-get install -y curl gnupg2
       - pip install pip -U
       - pip install future
       - pip install Pillow
@@ -20,7 +20,7 @@ phases:
   build:
     commands:
       - ./torchserve_sanity.sh
-      - cd serving-sdk/ && mvn clean deploy && cd ../
+      - cd serving-sdk/ && mvn clean install && cd ../
 
 artifacts:
   files:

diff --git a/frontend/gradle.properties b/frontend/gradle.properties
@@ -6,4 +6,4 @@ slf4j_log4j12_version=1.7.25
 gson_version=2.8.5
 commons_cli_version=1.3.1
 testng_version=6.8.1
-mms_server_sdk_version=1.0.1
+torchserve_sdk_version=0.0.3
diff --git a/frontend/server/build.gradle b/frontend/server/build.gradle
@@ -2,7 +2,7 @@ dependencies {
     compile "io.netty:netty-all:${netty_version}"
     compile project(":modelarchive")
     compile "commons-cli:commons-cli:${commons_cli_version}"
-    compile "software.amazon.ai:mms-plugins-sdk:${mms_server_sdk_version}"
+    compile "org.pytorch:torchserve-plugins-sdk:${torchserve_sdk_version}"
     testCompile "org.testng:testng:${testng_version}"
 }
 

diff --git a/frontend/server/src/main/java/org/pytorch/serve/ModelServer.java b/frontend/server/src/main/java/org/pytorch/serve/ModelServer.java
@@ -29,6 +29,9 @@
 import org.pytorch.serve.archive.ModelArchive;
 import org.pytorch.serve.archive.ModelException;
 import org.pytorch.serve.metrics.MetricManager;
+import org.pytorch.serve.servingsdk.ModelServerEndpoint;
+import org.pytorch.serve.servingsdk.annotations.Endpoint;
+import org.pytorch.serve.servingsdk.annotations.helpers.EndpointTypes;
 import org.pytorch.serve.servingsdk.impl.PluginsManager;
 import org.pytorch.serve.snapshot.InvalidSnapshotException;
 import org.pytorch.serve.snapshot.SnapshotManager;
@@ -40,9 +43,6 @@
 import org.pytorch.serve.wlm.WorkLoadManager;
 import org.slf4j.Logger;
 import org.slf4j.LoggerFactory;
-import software.amazon.ai.mms.servingsdk.ModelServerEndpoint;
-import software.amazon.ai.mms.servingsdk.annotations.Endpoint;
-import software.amazon.ai.mms.servingsdk.annotations.helpers.EndpointTypes;
 
 public class ModelServer {
 

diff --git a/frontend/server/src/main/java/org/pytorch/serve/http/HttpRequestHandlerChain.java b/frontend/server/src/main/java/org/pytorch/serve/http/HttpRequestHandlerChain.java
@@ -11,15 +11,15 @@
 import java.util.Map;
 import org.pytorch.serve.archive.ModelException;
 import org.pytorch.serve.archive.ModelNotFoundException;
+import org.pytorch.serve.servingsdk.ModelServerEndpoint;
+import org.pytorch.serve.servingsdk.ModelServerEndpointException;
 import org.pytorch.serve.servingsdk.impl.ModelServerContext;
 import org.pytorch.serve.servingsdk.impl.ModelServerRequest;
 import org.pytorch.serve.servingsdk.impl.ModelServerResponse;
 import org.pytorch.serve.util.NettyUtils;
 import org.pytorch.serve.wlm.ModelManager;
 import org.slf4j.Logger;
 import org.slf4j.LoggerFactory;
-import software.amazon.ai.mms.servingsdk.ModelServerEndpoint;
-import software.amazon.ai.mms.servingsdk.ModelServerEndpointException;
 
 public abstract class HttpRequestHandlerChain {
     private static final Logger logger = LoggerFactory.getLogger(HttpRequestHandler.class);

diff --git a/frontend/server/src/main/java/org/pytorch/serve/http/InferenceRequestHandler.java b/frontend/server/src/main/java/org/pytorch/serve/http/InferenceRequestHandler.java
@@ -14,6 +14,7 @@
 import org.pytorch.serve.archive.ModelException;
 import org.pytorch.serve.archive.ModelNotFoundException;
 import org.pytorch.serve.openapi.OpenApiUtils;
+import org.pytorch.serve.servingsdk.ModelServerEndpoint;
 import org.pytorch.serve.util.NettyUtils;
 import org.pytorch.serve.util.messages.InputParameter;
 import org.pytorch.serve.util.messages.RequestInput;
@@ -23,7 +24,6 @@
 import org.pytorch.serve.wlm.ModelManager;
 import org.slf4j.Logger;
 import org.slf4j.LoggerFactory;
-import software.amazon.ai.mms.servingsdk.ModelServerEndpoint;
 
 /**
  * A class handling inbound HTTP requests to the management API.

diff --git a/frontend/server/src/main/java/org/pytorch/serve/http/ManagementRequestHandler.java b/frontend/server/src/main/java/org/pytorch/serve/http/ManagementRequestHandler.java
@@ -23,14 +23,14 @@
 import org.pytorch.serve.archive.ModelNotFoundException;
 import org.pytorch.serve.archive.ModelVersionNotFoundException;
 import org.pytorch.serve.http.messages.RegisterModelRequest;
+import org.pytorch.serve.servingsdk.ModelServerEndpoint;
 import org.pytorch.serve.snapshot.SnapshotManager;
 import org.pytorch.serve.util.ConfigManager;
 import org.pytorch.serve.util.JsonUtils;
 import org.pytorch.serve.util.NettyUtils;
 import org.pytorch.serve.wlm.Model;
 import org.pytorch.serve.wlm.ModelManager;
 import org.pytorch.serve.wlm.WorkerThread;
-import software.amazon.ai.mms.servingsdk.ModelServerEndpoint;
 
 /**
  * A class handling inbound HTTP requests to the management API.

diff --git a/frontend/server/src/main/java/org/pytorch/serve/servingsdk/impl/ModelServerContext.java b/frontend/server/src/main/java/org/pytorch/serve/servingsdk/impl/ModelServerContext.java
@@ -3,10 +3,10 @@
 import java.util.HashMap;
 import java.util.Map;
 import java.util.Properties;
+import org.pytorch.serve.servingsdk.Context;
+import org.pytorch.serve.servingsdk.Model;
 import org.pytorch.serve.util.ConfigManager;
 import org.pytorch.serve.wlm.ModelManager;
-import software.amazon.ai.mms.servingsdk.Context;
-import software.amazon.ai.mms.servingsdk.Model;
 
 public class ModelServerContext implements Context {
     @Override

diff --git a/frontend/server/src/main/java/org/pytorch/serve/servingsdk/impl/ModelServerModel.java b/frontend/server/src/main/java/org/pytorch/serve/servingsdk/impl/ModelServerModel.java
@@ -2,9 +2,9 @@
 
 import java.util.ArrayList;
 import java.util.List;
+import org.pytorch.serve.servingsdk.Model;
+import org.pytorch.serve.servingsdk.Worker;
 import org.pytorch.serve.wlm.ModelManager;
-import software.amazon.ai.mms.servingsdk.Model;
-import software.amazon.ai.mms.servingsdk.Worker;
 
 public class ModelServerModel implements Model {
     private final org.pytorch.serve.wlm.Model model;

diff --git a/frontend/server/src/main/java/org/pytorch/serve/servingsdk/impl/ModelServerRequest.java b/frontend/server/src/main/java/org/pytorch/serve/servingsdk/impl/ModelServerRequest.java
@@ -7,7 +7,7 @@
 import java.util.ArrayList;
 import java.util.List;
 import java.util.Map;
-import software.amazon.ai.mms.servingsdk.http.Request;
+import org.pytorch.serve.servingsdk.http.Request;
 
 public class ModelServerRequest implements Request {
     private FullHttpRequest req;

diff --git a/frontend/server/src/main/java/org/pytorch/serve/servingsdk/impl/ModelServerResponse.java b/frontend/server/src/main/java/org/pytorch/serve/servingsdk/impl/ModelServerResponse.java
@@ -5,7 +5,7 @@
 import io.netty.handler.codec.http.HttpHeaderNames;
 import io.netty.handler.codec.http.HttpResponseStatus;
 import java.io.OutputStream;
-import software.amazon.ai.mms.servingsdk.http.Response;
+import org.pytorch.serve.servingsdk.http.Response;
 
 public class ModelServerResponse implements Response {
 

diff --git a/frontend/server/src/main/java/org/pytorch/serve/servingsdk/impl/ModelWorker.java b/frontend/server/src/main/java/org/pytorch/serve/servingsdk/impl/ModelWorker.java
@@ -1,8 +1,8 @@
 package org.pytorch.serve.servingsdk.impl;
 
+import org.pytorch.serve.servingsdk.Worker;
 import org.pytorch.serve.wlm.WorkerState;
 import org.pytorch.serve.wlm.WorkerThread;
-import software.amazon.ai.mms.servingsdk.Worker;
 
 public class ModelWorker implements Worker {
     private boolean running;

diff --git a/frontend/server/src/main/java/org/pytorch/serve/servingsdk/impl/PluginsManager.java b/frontend/server/src/main/java/org/pytorch/serve/servingsdk/impl/PluginsManager.java
@@ -5,11 +5,11 @@
 import java.util.Map;
 import java.util.ServiceLoader;
 import org.pytorch.serve.http.InvalidPluginException;
+import org.pytorch.serve.servingsdk.ModelServerEndpoint;
+import org.pytorch.serve.servingsdk.annotations.Endpoint;
+import org.pytorch.serve.servingsdk.annotations.helpers.EndpointTypes;
 import org.slf4j.Logger;
 import org.slf4j.LoggerFactory;
-import software.amazon.ai.mms.servingsdk.ModelServerEndpoint;
-import software.amazon.ai.mms.servingsdk.annotations.Endpoint;
-import software.amazon.ai.mms.servingsdk.annotations.helpers.EndpointTypes;
 
 public final class PluginsManager {
 

diff --git a/plugins/build.gradle b/plugins/build.gradle
@@ -0,0 +1,88 @@
+/*
+ * This file was generated by the Gradle 'init' task.
+ *
+ * This generated file contains a sample Java Library project to get you started.
+ * For more details take a look at the Java Libraries chapter in the Gradle
+ * User Manual available at https://docs.gradle.org/5.4.1/userguide/java_library_plugin.html
+ */
+
+allprojects {
+    apply plugin: 'idea'
+    apply plugin: 'java'
+
+    version = '1.0'
+
+    repositories {
+        jcenter()
+    }
+
+    idea {
+        module {
+            outputDir = file('build/classes/java/main')
+            testOutputDir = file('build/classes/java/test')
+        }
+    }
+
+    task buildSagemaker("type": Jar) {
+
+        doFirst{ task ->
+            println "building $task.project.name"
+        }
+
+        with project.jar
+
+        doLast {
+            copy {
+                def fromDir = project.jar
+                def intoDir = "${rootProject.projectDir}/build/plugins"
+                from fromDir
+                into intoDir
+                println "Copying files from" + fromDir + " into " + intoDir
+            }
+        }
+    }
+
+    buildSagemaker.onlyIf {project.hasProperty("sagemaker")}
+}
+
+def javaProjects() {
+    return subprojects.findAll()
+}
+
+configure(javaProjects()) {
+    sourceCompatibility = 1.8
+    targetCompatibility = 1.8
+
+    defaultTasks 'jar'
+
+    apply from: file("${rootProject.projectDir}/tools/gradle/formatter.gradle")
+    apply from: file("${rootProject.projectDir}/tools/gradle/check.gradle")
+
+    test {
+        useTestNG() {
+            // suiteXmlFiles << new File(rootDir, "testng.xml") //This is how to add custom testng.xml
+        }
+
+        testLogging {
+            showStandardStreams = true
+            events "passed", "skipped", "failed", "standardOut", "standardError"
+        }
+    }
+
+    test.finalizedBy(project.tasks.jacocoTestReport)
+
+    compileJava {
+        options.compilerArgs << "-Xlint:all,-options,-static" << "-Werror"
+    }
+
+    jacocoTestCoverageVerification {
+        violationRules {
+            rule {
+                limit {
+                    minimum = 0.75
+                }
+            }
+        }
+    }
+}
+
diff --git a/plugins/endpoints/build.gradle b/plugins/endpoints/build.gradle
@@ -0,0 +1,19 @@
+dependencies {
+    compile "com.google.code.gson:gson:${gson_version}"
+    compile "org.pytorch:torchserve-plugins-sdk:${torchserve_sdk_version}"
+}
+
+project.ext{
+    sagemaker = true
+}
+
+jar {
+    includeEmptyDirs = false
+
+    exclude "META-INF/maven/**"
+    exclude "META-INF/INDEX.LIST"
+    exclude "META-INF/MANIFEST*"
+    exclude "META-INF//LICENSE*"
+    exclude "META-INF//NOTICE*"
+}
+
diff --git a/plugins/endpoints/src/main/java/org/pytorch/serve/plugins/endpoint/ExecutionParameters.java b/plugins/endpoints/src/main/java/org/pytorch/serve/plugins/endpoint/ExecutionParameters.java
@@ -0,0 +1,80 @@
+package org.pytorch.serve.plugins.endpoint;
+
+import com.google.gson.GsonBuilder;
+import com.google.gson.annotations.SerializedName;
+import java.io.IOException;
+import java.nio.charset.StandardCharsets;
+import java.util.Properties;
+import org.pytorch.serve.servingsdk.Context;
+import org.pytorch.serve.servingsdk.ModelServerEndpoint;
+import org.pytorch.serve.servingsdk.annotations.Endpoint;
+import org.pytorch.serve.servingsdk.annotations.helpers.EndpointTypes;
+import org.pytorch.serve.servingsdk.http.Request;
+import org.pytorch.serve.servingsdk.http.Response;
+
+@Endpoint(
+        urlPattern = "execution-parameters",
+        endpointType = EndpointTypes.INFERENCE,
+        description = "Execution parameters endpoint")
+public class ExecutionParameters extends ModelServerEndpoint {
+
+    @Override
+    public void doGet(Request req, Response rsp, Context ctx) throws IOException {
+        Properties prop = ctx.getConfig();
+        // 6 * 1024 * 1024
+        int maxRequestSize = Integer.parseInt(prop.getProperty("max_request_size", "6291456"));
+        ExecutionParametersResponse r = new ExecutionParametersResponse();
+        r.setMaxConcurrentTransforms(Integer.parseInt(prop.getProperty("NUM_WORKERS", "1")));
+        r.setBatchStrategy("MULTI_RECORD");
+        r.setMaxPayloadInMB(maxRequestSize / (1024 * 1024));
+        rsp.getOutputStream()
+                .write(
+                        new GsonBuilder()
+                                .setPrettyPrinting()
+                                .create()
+                                .toJson(r)
+                                .getBytes(StandardCharsets.UTF_8));
+    }
+
+    /** Response for Model server endpoint */
+    public static class ExecutionParametersResponse {
+        @SerializedName("MaxConcurrentTransforms")
+        private int maxConcurrentTransforms;
+
+        @SerializedName("BatchStrategy")
+        private String batchStrategy;
+
+        @SerializedName("MaxPayloadInMB")
+        private int maxPayloadInMB;
+
+        public ExecutionParametersResponse() {
+            maxConcurrentTransforms = 4;
+            batchStrategy = "MULTI_RECORD";
+            maxPayloadInMB = 6;
+        }
+
+        public int getMaxConcurrentTransforms() {
+            return maxConcurrentTransforms;
+        }
+
+        public String getBatchStrategy() {
+            return batchStrategy;
+        }
+
+        public int getMaxPayloadInMB() {
+            return maxPayloadInMB;
+        }
+
+        public void setMaxConcurrentTransforms(int newMaxConcurrentTransforms) {
+            maxConcurrentTransforms = newMaxConcurrentTransforms;
+        }
+
+        public void setBatchStrategy(String newBatchStrategy) {
+            batchStrategy = newBatchStrategy;
+        }
+
+        public void setMaxPayloadInMB(int newMaxPayloadInMB) {
+            maxPayloadInMB = newMaxPayloadInMB;
+        }
+    }
+}